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1.1 我 们 的 哲学 


请 参见 Youtube 视 频 。 


1.2 本 书 的 结构 


与 某 些 教科 书 不 同 ， 本 书 并 没有 采取 自 上 而 下 的 叙述 方式 ， 而 是 采用 了 对 话 发 展 的 方式 ， 有 
时 也 会 回头 描述 讲 过 的 话题 。 如 同 现实 中 的 程序 员 ， 我 们 通常 一 步 一 步 来 构造 程序 。 有 时 候 
我 们 的 程序 也 会 包括 错误 ， 这 并 不 是 因为 我 不 知道 该 怎么 写 出 正确 的 程序 ， 而 是 因为 这 是 帮 
助 你 学 习 的 最 好 方式 。 错 误会 迫使 你 没 法 被 动 的 学 习 ， 而 是 必须 钻研 : 你 永远 也 没 法 确信 读 
到 的 材料 就 是 丨 实 的 。 


最 终 ， 你 会 得 到 正确 的 答案 。 短 期 来 说 ， 这 种 方式 使 挫折， 而 且 读者 也 没 法 将 本 书 当做 参 
考 书 来 使 用 (你 没 法 打开 书 ， 翻 到 随便 一 页 ， 就 认为 其 中 的 内 容 是 正确 的 ) 。 但 是 ， 挫 败 感 
是 学 习 的 一 个 部 分 。 我 不 觉得 有 好 方法 绕 开 它 。 

在 书 中 你 会 遇 到 

练习 


这 是 练习 O 请 青 做 题 页 O 


这 和 传统 教材 中 的 练习 题 一 样 ， 需 要 你 独立 完成 。 如 果 你 确实 在 某 个 课程 中 使 用 本 教材 ， 有 
可 能 这 就 是 课 后 作业 。 但 是 本 书 也 包含 这 种 : 


元 


这 是 思考 题 ， 你 看 到 了 吗 


当 你 看 到 思考 题 的 时 候 ， 请 停 下 来 。 阅 读 、 思 考 ， 形 成 答案 之 后 再 继续 。 这 是 因为 思考 题 
质 上 就 是 练习 题 ， 唯 一 的 区 别 是 后 文 会 给 出 其 答案 ， 或 者 你 可 以 通过 运行 程序 自行 得 到 答 
案 。 如 果 你 不 加 思考 的 继续 阅读 ， 那 么 你 就 会 读 到 答案 (或 者 ， 如 果 答 案 是 可 以 通过 运行 程 
序 获 得 的 情况 下 ， 完 全 忽略 答案 ) 。 这 样 做 既 没 有 测试 你 的 知识 水 平 ， 也 无 法 锻炼 你 的 思维 
能 力 。 换 一 种 说 法 ， 思 考题 是 鼓励 你 积极 学 习 的 一 部 分 。 


1.3 本 书 使 用 的 语言 


本 书 使 用 的 主要 语言 是 Racket。 然 而 ， 多 操作 系统 一 样 ，Racket 支 持 很 多 编程 语言 ， 所 
以 你 必须 显 式 的 告诉 Racket 你 在 使 用 什么 语言 进行 编程 。 在 Unix 系 统 的 shell 脚 本 中 你 需要 在 
脚本 开头 添加 如 下 一 行 来 指明 语言 : 


#!/bin/sh 


在 脚本 的 头 部 ， 你 可 能 会 类 似 的 指定 


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN™" ...> 


类 似 的 ，Racket 需 要 你 声明 所 使 用 的 语言 。Racket 语 言 可 能 使 用 和 Racket 一 样 的 括号 语法 ， 

但 是 有 不 同 的 语义 ; 或 语义 相同 语法 不 同 ; 或 者 有 不 同 的 语法 和 语义 。 因 此 每 个 Racket 程序 
以 #1ang < 语言 名 字 > 开头 。 黑 认 的 语言 为 Racket (名 字 为 racket) 。【 注 释 】 这 本 书 中 我 们 几 
乎 总 是 使 用 语言 : 


plai-typed 


si 3 中 ， 打 开 * 语 言 /Language" 菜 单 ， "选择 语言 /Choose Language”" 菜 单 
项 ， 然 后 选择 "使 用 代码 中 指定 的 语言 /Use the language declared in the source”。 


使 用 该 语言 时 ， 除 非特 别 指 明 ， 请 在 程序 的 第 一 行 添加 (本 书后 面 例子 代码 中 请 假定 我 们 添 
加 了 该 行 ) 


#lang plai-typed 


TYyped PLAI 语 言 和 传统 Racket 最 主要 的 不 同 是 它 是 静态 类 型 的 。 它 还 给 你 提供 了 些 有 用 的 的 
东西 (construct) : define-type 、 type-case 和 test 。【 注 释 】 下 面 是 它们 的 使 用 实例 。 
创建 新 的 数据 类 型 : 
它 还 提供 了 其 他 一 些 有 用 的 命令 ， 比 如 控制 测试 输出 的 命令 等 。 请 参考 该 语言 的 文档 了 
解 。 在 DrRacket 版 本 5.3 中 ， 打 开 *“ 帮 助 /Help” 菜 单 ， 选 择 “ 帮 助 台 /Help Desk” 菜 单项 ， 然 
后 在 帮助 台 的 搜索 栏 中 输入 “plai-typed”。 


(define-type MisspelledAnimal 
[caml (humps : number)] 
[yacc (height : number)]) 


它 做 的 事情 类 似 于 在 Java 中 : 创建 抽象 类 MisspelledAnimal ， 它 有 两 个 实体 子 
类 : caml 和 yacc ， 它 们 的 构造 参数 分 别 为 humps 和 height 。 


该 语言 中 ， 我 们 通过 下 面 方式 创建 实例 : 


(caml 2) 
(yacc 1.9) 


如 同 其 名 字 瞳 示 的 ， define-type 会 创建 给 定名 字 的 数据 类 型 。 当 我 们 把 该 数据 类 型 的 值 绑 定 
到 变量 时 就 需要 用 到 其 类 型 : 


(define mai : MisspelledAnimal (caml 2)) 
(define ma2 : MisspelledAnimal (yacc 1.9)) 


事实 上 这 里 你 并 不 需要 显 式 的 声明 类 型 ， 因 为 Typed PLAI 在 很 多 情况 下 (包括 这 里 ) 都 能 够 
推断 出 正确 的 数据 类 型 。 因 此 上 面 的 代码 可 以 写成 : 


(define mai (caml 2)) 
(define ma2 (yacc 1.9)) 


不 过 我 们 倾向 于 对 类 型 进行 显 式 的 声明 。 这 么 做 一 方面 是 兽 棠 规则 ， 另 一 方面 当 我 们 日 后 阅 
读 代 码 时 有 助 于 理解 。 
类 型 的 名 字 可 以 递归 的 使 用 ， 本 书 会 经 常 使 用 这 种 方式 (例如 2.4 节 中 ) 。 
该 语言 为 我 们 提供 了 模式 匹配 功能 ， 例 如 这 个 函数 体 : 
(define (good? [ma : MisspelledAnimal]) : boolean 
(type-case MisspelledAnimal ma 


[caml (humps) (>= humps 2)] 
[yacc (height) (> height 2.1)])) 


在 表达 式 (>= humps 2) 中 ， humps 被 绑 定 为 caml 实例 的 构造 时 所 用 到 的 参数 。 
后 


最 后 ， 你 应 该 编写 测试 案例 ， 理 想 情况 下 ， 应 该 在 开始 定义 函数 之 前 写 。 当 然 在 定义 函数 之 
后 也 需要 写 ， 以 防 代 码 被 意外 修改 。 


(test (good? ma1i) #t) 
(test (good? ma2) #f) 


当 你 运行 上 面 的 代码 时 ， 语 言 会 告诉 你 两 个 测试 都 通过 了 。 要 了 解 更 多 请 参阅 文档 。 


这 里 有 一 点 可 能 比较 费解 。 在 模式 匹配 中 ， 匹 配 数 据 字段 时 我 们 使 用 了 和 数据 定义 时 相同 的 
名 字 ，humps (和 height ) 。 这 是 完全 没有 必要 的 ， 模 式 匹 配 是 基于 位 置 的 而 不 是 名 字 。 
因此 我 们 完全 可 以 使 用 其 它 名 字 : 


(define (good? [ma : MisspelledAnimal]) : boolean 
(type-case MisspelledAnimal ma 
[caml (h) (>= h 2)] 
[yacc (h) (> h 2.1)])) 


因为 每 个 h 仅 在 其 被 引入 的 匹配 分 支 中 可 见 ， 所 以 上 面 的 代码 没有 重 名 的 问题 。 命 名 是 请 尊 党 
传统 和 可 读 性 。 通 常 来 说 ， 定 义 数据 类 型 时 可 以 使 用 长 而 描述 性 的 名 字 ; 而 定义 类 型 子 句 时 
请 使 用 简短 的 名 字 ， 因 为 日 后 这 些 名 字 会 不 断 被 用 到 。 


我 觉得 很 少 有 需要 你 会 用 到 类 型 判断 函数 (如 caml?) ， 不 过 你 可 以 用 。 数 据 类 型 定义 时 还 会 
生成 字段 提取 函数 ， 例 如 caml-humps 。 有 时 候 ， 直 接 使 用 字段 提取 函数 会 比 使 用 模式 匹配 更 
简单 。 当 然 一 般 来 说 还 是 模式 匹配 更 好 用 ， 就 如 刚才 的 good? 所 示 。 不 过 为 了 完整 ， 我 们 实 

现 如 下 : 


(define (good? [ma : MisspelledAnimal]) : boolean 
(cond 
[(caml? ma) (>= caml-humps ma) 2] 
[(yacc? ma) (> (yacc-height ma) 2.1)])) 


思考 题 


如 果 给 函数 传 入 了 错误 的 数据 类 型 会 发 生 什 么 ? 比如 传 给 caml 构 造 器 一 个 字符 串 ? 或 者 
传 给 前 述 两 个 版 本 的 good? 函数 一 个 数 ? 


2 本 书 有 关 语 法 解析 的 一 切 


语法 解析 (parsing) 是 将 输入 字符 流转 换 成 结构 化 内 部 表示 的 过 程 。 常 见 的 内 部 表示 是 树 ， 
程序 可 以 递归 地 处 理 树 这 文 种 数据 和 吉 构 o 例如 9 给 定 输入 流 : 


23+5-6 


我 们 可 以 将 其 转换 成 根 节点 为 加 法 ， 节点 表示 数 23 ， 右 边 节点 是 用 树 表示 5-6 的 树 。 
语法 解析 器 (parser) 是 用 于 实现 这 0 o 


语法 解析 本 身 是 个 比较 复杂 ， 且 由 于 歧义 的 存在 ， 还 远 没有 被 解决 的 问题 。 例 如 上 面 的 例 
子 ， 你 还 可 以 将 其 转换 成 根 节点 为 减法 ， 子 树 为 加 法 的 树 。 我 们 还 需要 考虑 加 法 操作 符 的 是 
否 符合 交换 性 (左右 参数 是 否 能 互 换 ) 等 问题 。 要 解析 功能 完整 的 语言 (暂且 不 提 自 然 语 
言 ) ， 要 考虑 的 问题 只 会 更 多 更 复杂 。 


2.1 轻 量 级 的 ， 内 建 的 语法 解析 器 的 前 半 部 分 


这 些 问 题 使 得 语法 解析 本 身 适 合 当 作 单独 的 主题 来 讲 ， 也 确实 有 很 多 书本 、 课 程 和 工具 专注 
于 该 方面 。 从 我 们 的 角度 来 说 ， 语 法 解析 是 种 令 人 分 心 的 东西 ， 因 为 我 们 想 学 习 的 是 编程 语 
言 的 除去 语法 解析 的 各 个 部 分 。 因 此 ， 我 们 使 用 Racket 一 个 有 用 的 功能 来 将 输入 流转 换 成 

树 : read 。 read 和 该 语言 的 括号 语法 形式 紧密 关联 ， 它 将 括号 形式 的 字符 流转 换 成 内 部 树 
形式 。 例 如 ， 运 行 (read) 然后 输入 一 一 


(+ 23 (- 5 6)) 


一 一 会 产 出 一 链表 ， 其 第 一 个 元 素 是 符号 '+ ， 第 二 个 元 素 是 数 23 ， 第 三 个 元 素 是 链表 ; 
链表 其 第 一 个 元 素 是 符号 ，- ， 第 二 个 元 素 是 数 5 ， 第 三 个 元 素 是 数 6 。 


2.2 快捷 方式 


你 应 该 知道 ， 程 序 都 会 需要 详尽 的 测试 ， 而 每 次 测试 都 需要 手工 输入 会 很 麻烦 。 幸 运 的 是 ， 
你 可 能 猜 得 到 ， 括 号 表达 式 可 以 在 Racket 中 用 引号 来 表达 ， 也 就 是 你 刚才 看 到 的 '<expr> 形 
式 其 效果 和 运行 (read) 然后 输入 <expr> 一 样 。 





2.3 语法 解析 得 到 的 类 型 


泣 


事实 上 ， 我 刚才 的 描述 并 不 准确 。 之 前 说 (read) 会 返回 链表 等 类 型 。 在 Racket 中 确实 如 此 ， 
但 在 Typed PLAI 中 ， 事 情 稍 有 不 同 ， (read) 返回 值 类 型 为 s-expression (符号 表达 式 的 简 
5) 。 


> (read ) 

- S-expression 

[type in (+ 23 (- 5 6))] 
'(+ 23 (- 5 6)) 


Racket 包 含 了 强大 的 Ss-expression 系 统 ， 其 语法 还 甚至 可 以 表达 带 循 环 的 结构 。 不 过 我 们 只 会 
用 到 其 中 的 一 部 分 。 


在 静态 类 型 的 语言 中 ，s-expression 被 认为 是 和 其 他 类 型 (例如 数 、 链 表 ) 都 不 同 的 数据 。 在 
计算 机 内 部 ，Ss-expression 是 一 种 递归 数据 类 型 ， 其 基本 构造 是 原子 值 一 例如 数 、 字 符 串 、 
符号 ， 组合 形式 可 以 是 表 、 向 量 等 。 因 此 ， 原 子 值 ( 数 、 字 符 囊 、 符 号 等 ) 即 是 其 自由 类 
型 ， 也 是 一 种 Ss-eXpression。 这 就 造成 了 输入 的 歧义 ， 我 们 后 文 讨论 。 


Typed PLAI 采 取 一 种 简单 的 方式 来 处 理 这 种 歧义 : 当 直接 输入 时 ， 原 子 结构 就 是 它 本 身 的 类 


型 ; 当 输 入 为 大 结构 的 一 部 分 时 一 一 包括 read 或 者 引用 一 一 它们 就 是 s-expression 类 型 。 你 可 
以 通过 类 型 转换 将 其 转换 为 基本 类 型 。 例 如 : 


> “十 

- Symbol 

“十 

> (define 1 '(+ 1 2)) 

> 

- S-expression 

'(+ 1 2) 

> (first 1) 

, typecheck failed: (listof '_a) vs s-expression in: 
first 


(quote (+ 1 2)) 
1 


first 
> (define f (first (s-exp->list 1))) 
= 
- S-expression 
'+ 


这 方面 和 Java 程 序 的 类 型 转换 类 似 。 我 们 后 文 再 学 习 类 型 转换 。 


请 注意 ， 表 结构 的 第 一 个 元 素 的 类 型 并 不 是 符号 : 表 形 式 的 s-expression 是 由 s-expressions 组 
成 的 表 。 因 此 ， 


> (symbol->string f) 
, typecheck failed: Symbol vs s-expression in: 
symbol->string 
f 
symbol->string 
f 
first 
(first (s-exp->list 1)) 
s-exp->list 


堪 


转换 : 


类 


> (Symbol->string (s-exp->symbol f)) 
- String 
HL 十 


必须 对 s-expressions 进 行 类 型 转换 确实 是 个 麻烦 事 ， 但 是 某 种 程度 的 麻烦 是 不 可 避免 的 : 因 
为 我 们 的 目的 是 把 没有 类 型 的 输入 ， 通 过 严谨 的 类 型 分 析 ， 和 转化 为 有 类 型 的 。 所 以 有 些 关 于 
输入 的 假设 必须 明文 给 出 。 


好 在 我 们 只 在 语法 解析 中 使 用 S-expressions， 而 我 们 的 目的 是 尽快 处 理 完 语法 解析 ! 所 以 ， 
这 一 点 只 会 帮助 我 们 尽快 摆脱 语法 解析 。 


2.4 完整 的 语法 解析 器 


原则 上 read 就 是 完整 的 语法 解析 器 。 不 过 其 输出 过 于 一 般 化 : 结构 体 中 并 不 包含 其 意向 的 注 
释 信息 。 所 以 我 们 倾向 于 使 用 更 具体 的 表达 方式 ， 类 似 于 前 文中 "表达 加 法 "和 "表达 数 " 的 那 
种 。 


首先 ， 我 们 必须 引入 一 种 数据 类 型 来 表示 这 类 关系 。 后 文 (3.1 节 ) 会 详细 讨论 为 啥 采用 这 种 
数据 类 型 ， 还 有 我 们 如 何 得 出 该 数据 类 型 。 现 在 请 先 假设 它 是 给 定 的 : 


(define-type ArithC 
[numC (n : number)] 
[pluscC (1 : Arithc) (r : Arithc)] 
[multCc (1 : Arithc) (r : Arithc)]) 


现在 我 们 需要 能 将 s-expression 解 析 成 该 数据 类 型 的 函数 。 这 就 是 语法 解析 器 的 另 一 半 : 


(define (parse [s : s-expression]) 
(cond 

[(s-exp-number? s) (numC (s-exp->number s))] 

[(s-exp-list? s) 

(let ([sl1 (s-exp->list s)]) 

(case (s-exp->symbol (first sl1)) 

[(+) (plusC (parse (second sl1l)) (parse (third sl1)))] 
[(*) (multC (parse (second sl1l)) (parse (third sl1)))] 
[else (error 'parse "invalid list input")]))] ;无 效 的 表 输 入 

[else (error 'parse "invalid input")])) ;无效 的 输入 


简单 运行 如 下 : 


> (parse '(+ (12) (+ 2 3))) 
- ArithC 
(plusc 
(multC (numC 1) (numC 2)) 
(plusC (numC 2) (numC 3))) 


恭喜 ! 你 完成 了 首 个 程序 的 表示 。 从 今 往 后 我 们 就 只 需要 处 理 用 递归 的 树 结构 表示 的 程序 
了 ， 再 也 不 用 担心 各 种 不 同 的 语法 ， 还 有 如 何 把 语法 转换 为 树 形 结构 了 。 我 们 终于 可 以 开始 
学 习 编程 语言 芯 了 | 


练习 


如 果 传 给 语法 解析 器 的 参数 总 了 加 引号 ， 后 果 是 啥 ?为 什么 ? 


2.5 尾声 


Racket 的 语 不 乏 争 议 。 不 过 请 观察 它 给 我 们 带 来 的 深层 次 好 处 : 对 
传统 语法 进行 解析 会 很 复杂 ， 而 解析 这 种 语法 则 | 了 ， 不 管 是 从 字符 流 到 s-expressions 
的 解析 ， 还 是 从 s-expressions 进 一 步 到 语法 树 的 解析 。 


这 种 语法 的 好 处 就 是 其 多 用 途 性 。 需 要 的 代码 少 ， 而 且 可 以 方便 的 插入 各 种 应 用 场景 。 所 以 
很 多 基于 Lisp 的 语言 其 语义 各 不 相同 ， 但 都 保留 了 历史 继承 而 来 的 这 种 语法 。 


当然 ， 我 们 也 可 以 采用 XML， 它 更 好 用 ; 或 者 JSON， 它 和 s-expression 有 着 本 质 的 不 同 ! 


3 解释 器 初 质 


现在 有 了 程序 的 表示 方法 ， 我 们 有 很 多 方式 可 以 用 来 操纵 它们 。 我 们 可 能 想 把 程序 打印 的 漂 
亮点 (pretty-print) ， 将 其 转换 成 其 它 格 式 的 代码 (编译 ) ， 查 看 其 是 否 符合 特定 属性 ( 校 
验 ) ， 等 等 。 现 在 ， 我 们 专注 于 考虑 得 到 其 对 应 的 值 一 一 计算 (evaluation) 一 一 将 程序 规约 
成 值 。 


让 我 们 来 为 我 们 的 算术 语言 写 个 解释 器 形式 的 求 值 器 。 选 择 算术 运算 是 出 于 下 面 三 个 主要 原 
因 : (a) 你 已 经 知道 怎么 计算 加 减 乘 除了 ， 我 们 可 以 专注 于 其 实现 ; (b) 基本 上 每 门 语言 
都 会 包含 算术 运算 ， 所 以 我 们 可 以 从 它 开 始 进行 语言 的 扩展 ; (c) 该 问题 大 小 合适 ， 足 以 展 
示 我 们 要 学 习 的 很 多 要 点 。 


3.1 算术 表达 式 的 表示 


我 们 首先 需要 统一 算术 表达 式 的 表示 法 。 我 们 只 打算 支持 两 个 运算 符 一 一 加 法 和 乘法 一 一 以 
及 基本 的 数 。 需 要 一 种 东西 来 表达 算术 表达 式 。 算 是 表达 式 的 谋 套 规则 是 哈 呢 ? 表达 式 可 以 
任意 地 嵌 套 。 








为 什么 我 们 不 把 除法 也 包括 进来 呢 ? 这 么 做 对 前 文 总 结 会 产生 什 
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这 里 不 包括 除法 的 原因 是 ， 我 们 暂时 不 打算 讨论 什么 表达 式 是 合法 的 。 显 然 1 除 以 2 是 合法 
的 ， 但 是 1 除 以 0 就 有 争议 了 。1 除 以 (1 减 去 1) 就 更 有 争议 了 。 目 前 我 们 无 需 陷 入 这 种 矛盾 ， 
以 后 再 讨论 o 


于 是 我 们 可 以 使 用 如 下 的 表达 式 : 


(define-type ArithC ;具体 算术 
[numc (n : number)] 
[pluscC (1 : Arithc) (r : Arithc)] 
[multCc (1 : ArithCc) (r : Arithc)]) 


3.2 写 个 解释 器 


下 面 开 始 写 该 算术 语言 的 解释 器 。 首 先 我 们 考虑 一 下 该 解释 器 的 类 型 : 它 的 输入 显然 
是 Arithc 值 ， 返 回 值 的 类 型 呢 ? 当然 是 数 啦 。 即 我 们 的 解释 器 是 输入 为 Arithc 输出 为 数 的 


练习 


为 该 解释 器 写 一 些 测试 案例 。 


由 于 输入 类 型 是 递归 定义 的 数据 类 型 ， 很 自然 的 解释 器 也 应 该 递归 地 处 理 输入 。 程 序 模板 如 
下 : 【注释 】 


(define (interp [a : ArithC]) : number 
(type-case ArithcC a 
[numC (Cn) n] 
[Hoa ee Le ea 
[mses me 


《程序 设计 方法 》 一 书 (又 译 《 如 何 设 计 程 序 》) 详细 介绍 了 模板 这 一 概念 。 


你 很 可 能 想当然 的 直接 写 出 如 下 的 代码 : 


(define (interp [a : ArithC]) : number 
(type-case ArithcC a 
[numC (n) nj] 
[plusC (1 r) (+ 1 r)] 
[muBtC (Gr ) (Cr 


首先 ， 我 们 先 补充 模板 代码 : 


(define (interp [a : ArithCc]) : number 
(type-case ArithC a 
[numC (n) n] 
pluscsn (Lr (INnterp Ll) (1nterp r) .a 
[muEte (Dr) (iNnterp 1) .InNnterp rr) ee.])) 


填充 必要 部 分 得 到 解释 器 : 


(define (interp [a : ArithC]) : number 
(type-case ArithcC a 
[numC (n) nj] 
[plusC (1 r) (+ (interp 1) (interp r))] 
[multCc (1 r) (* (interp 1) (interp r))])) 


这 样 ， 我 们 就 完成 了 第 一 个 解释 器 ! 我 知道 有 点 虎 头 蛇 尾 ， 但 是 我 保证 ， 得 越 来 越 复 


3 你 注意 到 了 中 ? 


有 件 事情 我 没 和 你 讲 清 楚 : 
思考 题 


在 这 个 语言 中 ， 加 法 和 乘法 的 “意义 ?是 啥 ? 


太 抽 象 了 ， 不 是 吗 ? 让 我 们 把 它 变 得 更 具体 一 些 。 计 算 机 中 有 很 多 种 不 同 的 加 法 : 


e。 首先 ， 有 很 多 种 不 同 的 数 : 国定 长 度 (例如 ，32 位 ) 整数 ， 带 符号 国定 长 度 (例如 ，31 
位 外 加 1 个 符号 位 ) 整数 ， 任 意 精 度 整 数 ; 在 有 些 语言 中 ， 有 理 数 ; 各 种 不 同 格式 的 固定 
位 数 浮 点 数 ; 在 有 些 语 言 中 ， 复 数 ; 如 此 等 等 。 在 确定 数 类 型 之 后 ， 加 法 可 能 只 支持 其 
中 的 一 部 分 组 合 。 


。 其 次 ， 茶 些 语言 支持 菜 些 〈 其 他 ) 数据 类 型 的 加 法 ， 比 如 答 阵 加 法 。 


e@ 再 次 ， 某 些 语言 支持 字符 串 “ 相 加 ”。 这 里 引号 表示 我 们 并 没有 进行 数学 上 相 加 的 操作 ， 而 
是 用 语法 上 用 + 符号 表示 操作 。 有 的 语言 用 这 表示 字符 串 拼 接 ; 也 有 语言 在 这 种 情况 下 返 
回 数 (比如 把 字符 串 所 表示 的 数 相 加 ) 。 


这 些 都 是 加 法 所 代表 的 不 同 含义 。 语 义 是 把 语法 (例如 +) 映射 到 含义 (例如 ， 以 上 列举 的 部 
分 或 者 所 有 ) 。 


于 是 游戏 来 了 : 以 下 哪些 是 相同 的 ? 
。 1+2 
。 1+2 
。 1+2 
。 1+'2 


回 到 之 前 的 问题 ， 我 们 用 的 语义 是 哈 ? 我 们 直接 使 用 了 Racket 所 提供 的 语义 ， 因 为 程序 直接 
把 + 映射 到 了 Racket 的 + 上 。 其 实 这 也 不 一 定 是 对 的 : 比如 说 ， 如 果 Racket 的 + 也 支持 字符 
串 ， 那 么 我 们 这 里 提供 的 操作 就 限制 + 只 能 用 在 数 上 (事实 上 Racket 的 + 并 不 支持 字符 
串 ) 。 


如 果 我 们 想 要 不 同 的 语义 ， 需 要 显 式 的 实现 出 来 。 
练习 
需要 哪些 修改 ， 这 里 的 加 法 能 支持 带 符号 32 位 数 的 算术 ? 


一 般 来 说 ， 我 们 需要 避免 简单 的 借用 宿主 语言 的 语义 。 后 面 我 们 还 会 讨论 这 个 话题 。 


3.4 扩展 此 语言 


我 们 选择 的 第 一 个 语言 功能 非常 有 限 ， 于 是 有 很 多 种 方式 可 以 将 其 扩展 。 有 的 扩展 ， 比 如 添 
加 数据 结构 和 函数 ， 就 必须 要 增加 解释 器 所 支持 的 数据 类 型 (假设 我 们 并 不 打算 采用 哥 德 尔 
计数 法 ) 。 其 他 的 扩展 ， 比 如 增加 更 多 算术 操作 ， 就 不 必修 改 核心 语言 及 其 解释 器 。 我 们 下 
一 章 就 讨论 此 问题 。 
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4 初试 去 语法 糖 


我 们 从 非常 斯 巴 达 式 的 算术 语言 开始 。 下 一 步 我 们 来 看 看 ， 在 现 有 语言 框架 下 怎么 支持 更 多 
算术 操作 。 我 们 只 加 2 种 ， 以 做 示范 。 


4.1 扩展 : 添加 双 目 减法 操作 


首先 ， 我 们 来 添加 减法 。 由 于 我 们 的 语言 已 经 包含 了 数 、 加 法 和 乘法 ， 用 这 些 操作 足以 定义 
减法 了 : 


好 的 ， 这 很 简单 ! 但 是 我 们 要 怎样 将 它 变 成 可 运行 的 代码 呢 。 首 先 ， 我 们 面临 一 个 决定 ， 将 
减法 操作 符 放 在 哪 ? 将 其 像 其 它 两 个 操作 符 一 样 处 理 ， 在 现 有 的 ArithC 数 据 类 型 中 添加 一 条 规 
则 ? 这 种 想法 看 上 去 很 自然 ， 也 很 请 人 。 


思考 题 
修改 ArithC 这 种 做 法 有 什么 不 好 的 地 方 呢 ? 


这 会 导致 几 个 问题 。 首 先 ， 显然 地 ， 我 们 将 需要 修改 所 有 处 理 ArithC 的 代码 。 就 目前 而 言 ， 还 
很 简单 ， 只 涉及 到 了 我 们 的 解释 器 。 但 是 如 果 在 更 为 复杂 的 语言 实现 中 ， 这 会 是 个 问题 。 其 
次 ， 要 添加 的 结构 是 可 以 用 已 实现 的 语法 结构 定义 的 ， 去 修改 已 有 数据 结构 的 方式 让 人 觉得 
代码 不 够 模块 化 。 最 后 一 点 ， 也 是 最 微妙 的 一 点 ， 修 改 ArithC 这 种 行为 有 概念 上 的 错误 。 因 为 
ArithC 描 述 的 是 我 们 语言 的 核心 部 分 。 而 减法 (和 其 他 类 似 添加 特性 ) 是 用 户 交 互 的 部 分 ， 属 
于 表层 语言 。 明 智 的 做 法 是 ， 将 不 同类 型 的 概念 放 到 不 同 的 数据 类 型 中 ， 而 不 是 把 它们 硬 塞 
到 一 起 。 有 时 候 这 么 做 看 上 去 有 点 策 拙 ， 不 过 长 远 来 看 ， 它 会 让 我 们 的 程序 更 易于 阅读 多 于 
维护 。 此 外 ， 你 可 能 会 将 不 同 的 功能 扩展 放 在 不 同 的 层次 上 ， 这 么 做 (将 核心 语法 和 表层 语 
法 区 分 开 ) 正 有 利于 这 么 做 。 


因此 ， 我 们 尝试 定义 新 的 数据 类 型 来 反应 我 们 的 表层 语言 语法 结构 : 


(define-type ArithS ;表层 算术 
[nums (n : number)] 
[plusSs (1 : ArithS) (r : Ariths)] 
[bminusSs (1 : ArithS) (r : Ariths)] 
[multSs (1 : ArithS) (r : Ariths)]) 


它 看 起 来 和 ArithC 基 本 相同 ， 遵 从 了 相似 的 递归 结构 ， 唯 一 的 区 别 就 是 加 了 一 个 子 句 。 


数据 类 型 定 了 ， 接 下 来 需要 做 两 件 事 。 第 一 是 要 修改 语法 解析 器 ， 让 其 返回 ArithS 类 型 数据 
(而 不 是 ArithC 类 型 ) 。 第 二 是 要 实现 去 语法 糖 (desugar) 函数 ， 它 需要 能 把 Ariths 值 转 

换 成 Arithc 值 。 

先 来 实现 去 语法 糖 函 数 简单 的 部 分 : 


<desugar> ::= ;去 语法 糖 
(define (desugar [as : ArithS]) : ArithC 
(type-case Ariths as 
[numS (n) (numC n)] 
[pluss (1 r) (plusc (desugar 1) 
(desugar r))] 
[multS (1 r) (multC (desugar 1) 


(desugar r))] 
<bminusS-case>)) ;二 元 减法 子 句 


把 数学 描述 转化 为 代码 : 
<bminusS-case> ::= 二 元 减法 子 句 


[bminusSs (1 r) (plusC (desugar 1) 
(multC (numC -1) (desugar r)))] 


思考 题 


常见 错误 是 忘 了 递归 地 对 1 和 进行 desugar 操 作 。 忘 了 会 发 生 什么 ?请 自行 尝试 。 


4.2 扩展 : 取 负 数 操作 


让 我 们 来 考虑 另 一 种 更 有 意思 的 扩展 ， 取 负数 操作 (unary negation ) 。 这 使 得 你 需要 对 语法 
修整 ， 当 读 到 - 符号 时 ， 需 要 往 前 读 以 判断 它 是 减法 还 是 取 负 操作 。 但 这 不 
! 


取 负 数 操作 可 以 有 几 种 去 语法 糖 的 方法 。 很 自然 的 我 们 会 想到 : 
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继续 完成 减法 的 去 语法 糖 操作 ， 我 们 得 到 : 


-b=0+-1xb 


你 觉得 这 两 种 中 哪个 更 好 呢 ?为 什么 ? 


大 家 可 能 希望 使 用 第 一 种 方式 ， 因 为 它 看 起 来 更 为 简单 。 假 设 我 们 扩展 了 Ariths 数据 类 型 ， 
添加 取 负 数 的 表示 法 : 


[uminusSs (e : ArithS)] ;一 元 减法 表达 式 


对 应 去 语法 糖 的 实现 也 很 直接 : 


[(uminusS (e) (desugar (bminusS (numS 0) e)))] 


检查 看 看 有 没有 类 型 错误 。 e 是 Ariths 类 型 ， 所 以 它 可 以 被 当 作 参数 传递 给 bminuss 来 进 
行 去 语法 糖 操作 。 所 以 这 里 要 做 的 不 是 对 e 去 语法 糖 ， 而 是 将 其 直接 上奏 入 到 生成 的 表达 式 中 。 
在 去 语法 糖 的 工具 中 ， 这 种 直接 将 某 个 输入 项 诅 入 到 另 一 个 项 中 ， ed i 
数 的 做 法 很 常见 ， 被 称 之 为 宏 (macro) 。 (在 我 们 这 个 例子 中 ，“ 宏 "是 umiunss 的 定义 。) 


然而 该 定义 存在 两 个 问题 : 
1. 第 一 个 问题 是 ， 该 递归 是 生成 的 hed ， 这 需要 我 们 得 对 其 进行 特别 关注 。【 注 
释 】 我 们 可 能 会 希望 使 用 下 面 这 种 方式 来 重 写 


[uminusS (e) (bminusS (numS 0) (desugar e))] 


它 确实 消除 了 生成 性 (generativity) 。 


如 果 你 没 听 过 生成 递归 ， 可 以 阅读 《程序 设计 方法 》 (又 译 《 如 何 设计 程序 》) 一 书 第 
五 部 分 简单 来 说 在 生成 递 归 中 ， 子 问 题 是 输入 的 计算 结果 > 而 不 是 输 入 的 子 成 分 O 我 
们 这 个 例子 还 是 很 简单 的 ， 这 里 的 “计算 ”就 是 bminuss 构造 函数 。 


思考 是 
很 不 幸 的 是 ， 上 面 的 转换 有 问题 ， 试 着 找 出 问题 吧 。 找 不 出 的 话 ， 和 运行 一 下 试 斌 。 

第 二 个 问题 是 ， 它 依赖 于 bminuss 的 意义 ;如果 bminuss 的 意义 发 生变 化 ， uminuss 的 意义 

也 就 发 生 了 变化 ， 即 使 我 们 并 没 打 算 改 变 uminuss 的 意义 。 作 为 对 比 ， 另 一 种 更 和 鲁 棒 的 做 法 


是 ， 定 义 函 数 ， 其 输入 是 两 个 项 ， 输 出 是 第 一 个 项 加 上 -1 乘 以 第 二 个 项 的 表示 法 ， 然 后 用 该 
鸥 数 来 定义 uminuss 和 bminuss 。 


你 可 能 会 说 ， 减 法 的 意义 不 可 能 发 生 改 变 ， 这 么 做 有 只 意义 呢 ? 事情 并 不 总 是 这 样 的 。 确 实 
减法 的 意义 不 太 可 能 改变 ; 但 是 另 一 方面 ， 它 的 实现 可 能 会 改变 。 例 如 ， 开 发 者 决定 为 减法 
操作 打印 日 志 。 采 用 前 一 种 做 法 ( 宏 展开 ) ， 所 有 取 负 数 操作 就 也 会 打出 日 志 ; 而 采用 后 一 
种 做 法 就 不 会 。 

很 直 运 ， 这 个 例子 我 们 还 有 更 简单 的 选择 : 


-b= -1 xb 


这 种 展开 方式 完全 可 行 ， 而 且 还 是 结构 递归 。 我 们 花 这 些 篇 幅 讨 论 各 种 不 同 展开 方式 的 原因 
是 ， 告 诉 你 各 种 选择 和 其 带 来 的 问题 ， 毕 竟 现 实 中 你 不 会 总 是 那么 幸运 。 


个 
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正 的 语言 。 比 如 说 可 以 添加 诸如 条 件 语 句 这 个 特性 ， 但 是 一 个 语言 要 趴 
变 得 有 意思 ， 它 需要 函数 或 者 某 种 等 价 于 函数 的 东西 。 所 以 我 们 就 直接 来 添加 函数 好 了 。 


给 语言 添加 条 件 语句 。 你 可 以 选择 添加 布尔 类 型 ， 或 者 方便 起 见 ， 你 的 条 件 语 句 可 以 将 0 
视 作 false， 其 他 值 视 作 true 。 


想象 一 下 ， 我 们 要 构造 一 个 类 似 于 DrRacket 的 系统 。 程 序 员 在 定义 (definitions) 窗口 中 定义 
函数 ， 然 后 在 交互 (interactions) 窗口 中 使 用 它们 。 我 们 先 假设 函数 只 能 在 定义 窗口 定义 ; 

交互 窗口 中 只 能 出 现 表达 式 (这 些 限 制 会 随 着 内 容 的 深入 被 解除 ) 。 按 此 假定 ， 当 运行 程序 

时 ， 函 数 已 经 被 解析 可 供 使 用 。 所 以 ， 我 们 给 解释 器 添加 一 个 参数 一 “函数 定义 的 集合 。 


注意 这 里 我 们 说 的 是 函数 的 集合 ， 也 就 是 说 ， 任 何 函 数 的 定义 中 可 以 引用 任意 其 它 函 
数 。 这 是 我 有 意 的 设计 。 当 你 设计 自己 的 语言 时 ， 记 住 注意 考虑 这 一 点 。 


5.1 定义 函数 的 数据 表示 
简单 起 见 ， 我 们 仅 考虑 只 有 一 个 参数 的 函数 。 下 面 是 一 些 Racket 函 数 的 例子 


(define (double x) (+ x x)) 
(define (quadruple x) (double (double x))) 


(define (const5 _) 5) 


练习 

如 果 函 数 可 以 带 有 多 个 参数 呢 ? 参数 名 之 间 有 什么 限制 ? 
函数 的 定义 包含 哪些 内 容 ? 它 包 含 名 字 (上 文中 的 double ， quadruple ， const5 ) ， 我 们 
将 使 用 符号 (symbol) 类 型 表示 ( 'double 等 ) ; 形 参 (formal parameter， 形 式 参数 的 简 


写 ) (例如 x ) ， 也 使 用 符号 类 型 表示 ( 'x ) ;最 后 还 有 函数 体 。 我 们 后 面 会 一 步 一 步 完 
善 郊 数 体 的 表示 法 ， 现 阶段 函数 定义 的 数据 类 型 如 下 : 


<fundef> ::= ;有 函数 定义 


(define-type FunDefC 
[fdC (name : Symbol) (arg : Symbol) (body : ExprCc)]) 


所 以 函数 体 是 什么 呢 ? 显然 它 可 以 是 算术 表达 式 ， 且 有 时 候 应 该 可 以 使 用 Arithc 语言 来 表 
示 : 例如 ， 函 数 const5 的 函数 体 可 以 使 用 (numc 5) 表示 。 但 是 要 表示 double 函数 的 函数 体 
需要 更 多 东西 : 不 仅 需要 加 法 (我 们 已 经 定义 了 ) ， 还 需要 “XxX”*。 你 可 能 会 称 它 变量 
(variable) ， 但 是 现在 我 们 不 使 用 该 术语 ， 我 们 叫 它 标识 符 (identifier) 。 


最 后 ， 我 们 看 看 quadruple 的 函数 体 ， 它 包含 另 一 种 结构 : 函数 调用 (application) 。 要 特别 
注意 函数 定义 和 调用 的 区 别 。 函 数 定义 描述 了 元 数 是 什么 ， 而 调用 则 是 对 函数 的 使 用 。 里 面 
一 层 的 double 兄 数 调用 使 用 的 实 参 (actual parameter， 实 际 参数 的 简写 ) 是 x ; 外 面 的 那 
层 的 double 调用 使 用 的 参数 是 (double x) 。 可 以 看 到 ， 参 数 可 以 是 任意 表达 式 。 


下 面 我 们 尝试 把 上 面 所 有 的 东西 炊 合 到 一 个 数据 类 型 中 。 显 然 我 们 需要 扩展 已 有 的 语法 ( 因 
为 我 们 还 想 保 留 草 术 运算 ) 。 我 们 给 新 的 数据 类 型 一 个 新 名 字 以 示 区 别 : 


<exprC> ::= ;表达 式 


(define-type Exprc 
[numC (n : number)] 
<idC-def> ;标识 符 的 定义 
<app-def> ;调用 的 定义 
[plusC (1 : ExprC) (Cr : EXxprc)] 
[multC (1 : ExprC) (Cr : ExprCc)]) 


标识 符 与 形 参 关系 紧密 。 当 调用 函数 时 ， 我 们 传 给 它 某 个 值 ， 从 效果 来 说 是 将 函数 体 中 出 现 
的 形 参 实例 一 一 所 有 同名 标识 符 替换 为 该 值 。 【注释 】 为 了 简化 这 个 搜索 替换 过 
程 ， 不 妨 使 用 与 形 参 相同 的 数据 类 型 来 表示 标识 符 。 形 参 的 数据 类 型 已 经 定好 了 ， 于 是 : 








<idC-def> ::= ;标识 符 的 定义 
[idc (s : symbol)] 
这 里 我 们 忽略 了 几 个 问题 :“ 值 ?是 什么 ? 何 时 替换 ? 后 文 会 继续 讨论 。 


最 后 ， 函 数 调用 。 它 包含 两 个 部 分 : 函数 名 和 (实际) 参数 。 上 面 已 经 说 过 参数 可 以 为 任意 
表达 式 (包括 标识 符 和 函数 调用 ) 。 至 于 函数 名 ， 让 其 和 函数 定义 中 的 函数 名 类 型 一 致 符合 
直觉 ， 就 这 样 做 吧 : 


<app-def> ::= ;调用 的 定义 


[appC (fun : Symbol) (arg : ExprcC)] 


该 定义 简单 明了 ， 函 数 名 指明 要 调用 哪个 函数 ， 然 后 后 面 提供 函数 调用 所 需 参 数 。 


有 了 定义 ， 看 看 之 前 的 三 个 函数 该 怎么 表示 : 


©® (fdc 'double 'x (plusC (idc 'x) (idc 'x))) 
® (fdc 'quadruple 'x (appC 'double (appC 'double (idc 'x)))) 


® (fdc 'const5 'x (numc 5)) 
下 面 还 需要 选择 函数 定义 集合 的 表示 法 。 使 用 链表 类 型 就 变 方 便 。 


小 心 ! 你 有 没有 注意 到 ， 之 前 我 们 说 这 是 函数 定义 的 集合 ， 然 而 实现 却 选 用 了 和 链表。 也 
就 是 说 ， 我 们 用 有 序 的 数据 结构 去 表达 无 序 的 数据 。 那 么 ， 测 试 时 ， 该 试用 
各 种 不 同 顺序 的 函数 定义 ， 以 确保 我 们 没有 不 小 心 引 入 了 (影响 结果 的 ) 顺序 


5.2 开始 实现 解释 器 


于 是 我 们 可 以 开始 实现 解释 器 了 。 首 先 考虑 解释 器 的 输入 是 什么 。 之 前 ， 只 需要 传 入 一 个 表 
达 式 即 可 ， 现 在 它 还 需要 传 入 函数 定义 的 表 。 


<interp> ::= ;解释 器 


(define (interp [e : ExprCc] [fds : (listof FunDefC)]) : number 
<interp-body>) ;解释 器 主体 


稍微 回顾 一 下 我 们 前 面 实现 的 解释 器 (第 三 章 ) 。 遇 到 数 ， 显 然 还 是 直接 返回 该 数 作为 结 

果 ; 遇 到 加 法 和 乘法 ， 还 是 应 该 一 样 递 归 的 求 值 。 递 中 时 该 用 什么 作 函 数 定义 呢 ? 由 于 求 值 
过 程 中 ， 既 不 需要 添加 也 不 需要 移 除 函数 定义 ， 即 函数 定义 集合 保持 不 变 ， 在 递归 时 函数 定 
义 应 该 原封 不 动 的 往 下 传递 。 


<interp-body> ::= ;解释 器 主体 
(type-case ExprC e 
[numC (n) nj] 
<idC-interp-case> ;解释 之 标识 符 子 句 
<appC-interp-case> ;解释 之 调用 子 名 
[plusC (1 r) (+ (interp 1 fds) (interp r fds))] 
[multC (1 r) (* (interp 1 fds) (interp r fds))]) 


接 下 来 实现 函数 调用 。 首 先 我 们 需要 从 函数 定义 中 寻找 对 应 的 函数 定义 ， 我 们 可 以 假设 如 下 
的 帮助 函数 可 以 实现 此 功能 : 


; get-fundef : Symbol * (listof FunDefC) -> FunDefC 


0 还 记得 之 前 说 过 元 数 调用 该 怎 
么 求 值 ? 搜索 标识 符 并 将 其 替换 为 实际 参数 。 这 个 搜索 替换 过 程 足够 重要 ， 值 得 花 一 小 节 讨 
论 ，5.4 节 我 们 再 回 过 来 实现 解释 器 


替换 是 将 一 个 表达 式 〈 这 里 是 函数 体 ) 中 某 个 名 字 〈 这 里 是 形 参 ) 替换 成 另 一 个 表达 式 〈 这 
里 是 实 参 ) 的 过 程 。 首 先 确定 其 类 型 : 


; Subst : ExprC * Symbol * ExprC -> EXprC 


将 参数 名 起 的 有 意义 些 : 


<Subst> ::= ;替换 


(define (subst [what : ExprC] [for : Symbol] [in : ExprC]) : EXxprC 
<subst-body>) ;替换 函数 的 主体 


在 in 表达 式 中 > 将 for 替换 成 what °° 
思考 题 
考虑 之 前 几 个 示例 函数 的 函数 体 ， 将 参数 x 替换 为 3 的 结果 是 什么 ? 


对 于 double 函数 来 说 ， 结 果 为 (+ 3 3) ;对 于 quadruple ， 结果 为 (double (double 3)) ， 
对 于 const5 ， 结 果 就 为 5 (函数 体 中 没有 出 现 x 所 以 也 没有 替换 ) 。 


对 于 double 一 个 常见 的 错误 是 将 其 替换 成 (define (double x) (+ 3 3)) 。 替 换 发 生 在 函 
数 调 用 时 ， 此 时 只 需要 函数 体 就 可 以 了 。 函 数 定 义 头 部 的 作用 是 找到 函数 ， 还 有 给 出 参 
数 的 名 称 ; 但 是 计算 其 值 时 只 需要 函数 体 。 如 果 用 整个 函数 定义 进行 替换 ， 试 试看 你 会 


得 到 哪 种 类 型 错误 。 


这 个 例子 几乎 涵盖 了 所 有 情况 。 如 果 是 数 的 话 ， 无 需 替 换 任何 东西 ; 如 果 是 标识 符 ， 例 子 没 
有 禾 盖 标识 符 不 同 的 情况 ， 你 也 能 想到 该 怎么 做 : 保留 之 ; 其 它 情况 ， 递 归 的 替换 各 子 表 达 
式 。 


在 开始 写 代 码 之 前 ， 还 有 一 种 重要 情况 要 考虑 一 下 。 假 设 我 们 要 替换 的 标识 符 恰巧 是 某 个 六 
数 名 称 ， 该 怎么 处 理 呢 ? 


该 怎么 处 理 呢 ? 


对 于 这 个 问题 ， 有 多 种 处 理 方法 。 一 种 方案 是 从 设计 上 来 来 考虑 : 函数 名 有 其 自己 的 “世界 ”， 
它 和 程序 中 其 它 标 识 符 都 不 同 。 某 些 语言 (例如 C 和 Common Lisp， 尽 管 它们 的 做 法 也 略 有 不 
同 ) 采取 这 种 策略 ， 根 据 标 识 符 使 用 的 位 置 将 其 解析 到 不 同 的 命名 空间 。 而 其 他 一 些 语言 则 
不 做 这 样 的 区 分 。 我 们 很 快 会 研究 这 么 一 种 语言 (后 文 ) 。 


现在 ， 我 们 从 务实 的 角度 来 处 理 这 个 问题 。 由 于 这 里 表达 式 求 值 结果 是 数 ， 这 就 要 问 函 数 名 
能 求 值 成 数 不 。 但 是 ， 数 不 能 命名 函数 ， 只 有 符号 能 。 所 以 进行 这 种 替换 是 没有 意义 的 ， 函 
数 名 和 要 替换 的 符号 没有 关系 。 (比如 ， 某 个 函数 的 参数 可 以 叫 x ， 其 函数 体 中 又 可 以 调用 
另 一 个 名 为 x 的 函数 ， 两 者 被 区 别处 理 。) 


决定 做 完了 ， 是 时 候 写 代码 了 : 


<subst-body> ::= ;替换 函数 的 主体 
(type-case ExprC in 
[numC (n) in] 
[idc (s) (cond 
[(symbol=? s for) what] 
[else in])] 
[appC (f a) (appC f (subst what for a))] 
[plusCc (1 r) (plusC (subst what for 1) 
(subst what for r))] 
[multC (1 r) (multC (subst what for 1) 
(subst what for r))]) 


练习 


请 注意 ， 在 numC 子 如， 解释 器 返回 n ， 而 替换 函数 返回 in ( 即 原始 表达 式 ， 在 这 个 位 
置 等 价 于 (numc n) ) ° 为 什么 ? 


5.4 继续 实现 解释 器 


搞定 了 替换 的 实现 〈 我 们 这 么 认为 ) ， 我 们 来 完成 解释 器 。 替 换 这 步 干 了 很 多 事 ， 好 在 函数 
调用 的 很 多 细节 都 在 其 中 完成 了 。 很 自然 的 想法 是 : 


<appC-interp-case-take-1> ::= ;解释 之 调用 子 句 ， 第 一 次 尝试 


[appCc (f a) (local ([define fd (get-fundef f fds)]) 
(subst a 
(fdc-arg fd) 
(fdc-body fd)))] 


但 是 这 是 错 的 。 
思考 是 
看 出 错 在 哪里 了 吗 ? 


从 类 型 角度 考察 ， 解 释 器 的 函数 返回 类 型 是 什么 ? 数 。 替 换 函 数 的 返回 类 型 呢 ? 表达 式 。 比 
如 说 ， 在 替换 double 的 函数 体 是 ， 可 能 得 到 的 结果 是 (+ 5 5) 的 表达 形式 。 这 并 不 是 解释 器 
的 合法 返回 值 。 需 要 进一步 对 其 来 值 。 所 以 应 该 这 么 做 : 


<appC-interp-case> ::= ;解释 之 调用 子 名 


[appCc (f a) (local ([define fd (get-fundef f fds)]) 
(interp (subst a 
(fdc-arg fd) 
(fdc-body fd)) 
fds))] 


好 了 ， 还 剩 下 最 后 一 个 子 句 : 标识 符 。 这 个 能 有 多 复杂 呢 ? 看 上 去 标识 符 类 似 数 那样 简单 ! 
然而 我 们 把 它 留 到 最 后 处 理 ， 这 说 明 到 了 它 的 处 理 可 能 有 点 微妙 或 者 说 有 点 复杂 。 


思考 题 
请 尝试 一 些 例 子 ， 从 而 理解 标识 符 该 怎么 处 理 。 

假设 double 函数 定义 如 下 : 
(define (double x) (+ x y)) 

我 们 把 x 替换 成 5 ， 得 到 (+ 5 y) 。 没 毛病 ， 然 而 剩 下 的 y 该 怎么 替换 呢 ? 事实 上 从 一 开 


始 我 们 就 应 该 意识 到 这 个 double 定义 是 错误 的 。 标 识 符 y 被 称 为 自由 的 (free) ， 这 是 个 负 
面 的 词 。 


掉 (被 称 为 被 绑 定 的 ， 这 是 种 正面 的 说 法 ) 。 因 此 ， 当 解释 器 直面 标识 符 时 ， 只 能 这 么 处 
理 : 


<idCc-interp-case> ::= ;解释 之 标识 符 子 句 


[idc (_) (error 'interp "shouldn't get here")] ;不 应 执行 到 这 里 


这 样 我 们 的 解释 器 就 完成 了 ! 
最 后 ， 为 了 完整 ， 我 们 还 需要 实现 get-fundef 


; 获取 函数 定义 
(define (get-fundef [n : Symbol] [fds : (listof FunDefC)]) : FunDefC 
(cond 
[(empty? fds) (error 'get-fundef "reference to undefined function")] ;引用 未 定义 的 
[(cons? fds) (cond 
[(equal? n (fdc-name (first fds)) 


) (first fds)] 
[else (get-fundef n (rest fds))])])) 


5.5 等 等 ， 还 没完 呢 1 
之 前 subst 的 类 型 我 们 说 是 : 


; Subst : ExprC * Symbol * ExprC -> EXprC 


简单 起 见 我 们 这 里 用 表面 语法 描述 问题 ， 假 设 我 们 在 解释 (double (+ 1 2)) 。 它 会 将 所 
有 x 都 替换 为 (+ 1 2) ， 于 是 解释 器 得 到 表达 式 (+ (+ 1 2) (+ 1 2)) 。 这 是 我 们 想 要 的 吗 ? 
在 学 习 代 数 时 ， 可 能 你 的 老师 不 是 这 么 教 你 的 : 首先 应 该 将 参数 规约 成 其 结果 (在 这 个 例子 


中 就 是 3 ) ， 然 后 将 参数 替换 为 这 个 结果 。 这 么 说 ， 替 换 的 类 型 就 应 该 是 : 


; Subst : number * Symbol * ExprC -> EXprC 


请 注意 ， 我 们 不 能 直接 把 数 放 入 表达 式 ， 而 是 必须 先 把 数 放 入 到 numC 调 用 中 。 所 以 ， 一 种 可 
行 的 做 法 是 ， subst 函数 可 以 把 第 一 个 参数 用 numC 包 装 起 来 然后 调用 辅助 函数 。 (事实 上 ， 
现 有 的 subst 函数 就 可 以 是 这 个 辅助 函数 : 它 接收 的 第 一 个 参数 的 类 型 是 ExprC， 那 么 当 传 给 
它 的 数据 是 numC 类 型 时 显然 没 问 题 。) 


事实 上 ， 替 换 的 实现 还 是 不 太 对 1 这 里 的 替换 函数 仅仅 能 处 理 我 们 的 示例 语言 ， 过 了 就 
不 行 了 。 这 给 问题 也 很 微妙 ， 它 被 称 为 “名 称 捕 获 "。 解 决 这 个 问题 是 复杂 ， 巧 妙 和 令 人 兴 
奋 的 智力 工作 。 不 过 这 里 我 不 打算 往 这 个 方向 发 展 。 所 以 本 书 中 我 们 绕 过 此 问题 。 不 过 
如 果 你 对 此 感 兴趣 ， 请 阅读 lambda 演 算 方 面 的 书籍 ， 它 们 会 提供 帮助 正确 地 实现 替换 。 


练习 
修改 解释 器 ， 用 答案 而 不 是 表达 式 替 换 标识 符 。 


我 们 这 里 过 到 的 问题 正 是 程序 语言 中 一 个 基本 设计 换 择 。 如 果 在 玲 换 前 就 把 参数 的 值 求 好 ， 
这 被 称 为 及 早 (eager) 求 值 ; 对 应 的 推迟 求 值 被 称 为 情 性 (lazy) 求 值 __ 它 本 身 又 有 几 种 
不 同 变化 。 我 们 这 里 倾向 于 使 用 及 早 求 值 语义 ， 因 为 大 部 分 主流 语言 都 采取 此 方式 。 后 面 也 
会 再 介绍 惰性 来 值 的 语义 和 后 果 。 


6 从 替换 模型 到 环境 模型 


尽管 我 们 已 经 实现 了 函数 ， 你 可 能 对 其 不 太 满 意 。 处 理 标 识 符 时 ， 直 观 上 应 该 是 “找到 它 绑 定 
的 值 *。 但 是 我 们 不 仅 没 这 样 做 ， 还 在 遇 到 标识 符 时 直接 抛 出 错误 ! 这 么 做 也 没 错 ， 但 感觉 怪 
怪 的 。 更 重要 的 是 ， 编 写 解释 器 是 为 了 让 其 理解 并 解释 我 们 的 语言 ， 而 该 解释 器 现在 看 来 并 
没有 达成 我 们 的 意愿 。 


使 用 替换 模型 的 另 一 个 问题 是 ， 它 需要 遍历 源 程 序 的 次 数 。 理 想 的 做 法 是 ， 只 访问 程序 中 被 
实际 求 值 的 部 分 ， 并 且 ， 仅 当 必 要 时 才 这 么 做 。 替 换 模 型 必须 遍历 程序 的 所 有 部 分 一 一 比如 
说 ， 条 件 分 支 中 不 执行 的 分 支 一 一 而 且 还 需要 遍历 程序 两 遍 ， 一 遍 赫 换 ， 一 遍 解 释 。 
练习 

替换 模型 会 影响 程序 运行 的 时 间 复 杂 性 吗 ? 


替换 模型 还 有 个 问题 ， 它 的 结构 受 限 于 源 代码 的 存储 。 当 然 ， 我 们 的 解释 器 需要 源 代码 ， 对 
其 解释 。 但 是 其 他 实现 方式 比如 说 编译 器 吓 源 代码 。【 注释 】 采 取 更 一 
般 的 策略 ， 不 依赖 于 具体 实现 方式 显然 更 为 合理 。 
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编译 器 可 能 也 需要 存储 菜 些 源 代码 信息 ， 以 实现 其 他 功能 。 上 比如 说 ， 报 告 运 
时 ， 或 者 进行 即时 编译 (JIT) 。 


6.1 介绍 环境 模型 


直觉 告诉 我 们 ， 解 决 第 一 个 问题 的 方法 是 ， 解 释 器 可 以 在 某 种 形式 的 字典 里 面 “ 寻 找 " 标 识 符 ; 
解决 第 二 个 问题 的 方法 是 ， 延 人 迟 蔡 换 。 棕 运 的 是 ， 这 两 点 结合 起 来 还 能 解决 第 三 个 问题 。 字 

典 里 面 记 录 的 是 将 要 进行 的 蔡 换 ， 而 并 不 对 原始 程序 进行 修改 。 因 为 记录 下 了 将 要 进行 的 替 
换 ， 而 并 非 直 接替 换 ， 我 们 可 以 延迟 进行 替换 步 又。 记录 替 换 内 容 的 数据 结构 被 称 为 环境 
(environment) 。 使 用 环境 模型 避免 了 源 代 码 级 别 的 重 写 ， 并 且 和 底层 的 计算 机 表示 法 很 好 
地 对 应 。 环 境 中 的 结合 关系 被 称 为 绑 定 (binding) 。 


注意 ， 这 里 我 们 要 修改 的 是 编程 语言 的 实现 策略 ， 而 不 是 修改 语言 本 身 。 因 此 用 于 表示 程序 
的 数据 结构 ， 还 有 解释 器 执行 的 结果 都 不 应 发 生 改 变 。 所 以 ， 我 们 可 以 将 之 前 那个 解释 器 当 
作 我 们 这 次 要 写 的 解释 器 的 “参考 实现 ”， 两 者 的 结果 应 该 一 致 。 实 际 上 ， 我 们 应 该 创建 一 个 测 
试 生 成 器 ， 让 它 生成 很 多 测 给 两 个 解释 器 来 执行 ， 并 确保 它们 返回 的 结果 都 相同 。 理 想 情况 
下 ， 我 们 应 该 证 明 两 个 解释 器 行为 一 致 ， 事 实 上 它 是 很 好 的 高 阶 课题 。 

这 里 的 "一致 "到 底 是 什么 意思 呢 ? 特别 地 ， 当 程序 运行 报错 时 呢 ? 
首先 ， 我 们 来 定义 环境 的 数据 结构 。 环 境 是 将 名 字 与 什么 的 绑 定 的 表 ? 


思考 题 


这 里 定义 数据 结构 时 ， 很 自然 的 问题 就 是 ， 环 境 中 将 名 字 映 射 成 了 什么 东西 。 但 是 我 们 
可 以 问 更 好 更 基本 的 问题 ， 我 们 如 何 得 出 这 个 很 自然 问题 的 答案 ? 


记 住 我 们 这 里 引入 环境 是 为 了 推迟 替换 过 程 。 因 此 ， 答 案 在 替换 中 。 我 们 在 上 一 章 最 后 一 节 
中 讨论 过 ， 我 们 希望 直接 将 名 字 替 换 为 计算 结果 ， 即 对 应 于 函数 的 及 早 求 值 策略 。 因 此 同样 
的 ， 环 境 中 应 该 将 名 字 映 射 为 求 值 结果 


(define-type Binding 
[bind (name : symbol) (val : number)]) 


(define-type-alias Env (listof Binding)) 


(define mt-env empty) 
(define extend-env cons) 


6.2 环境 模型 解释 器 


现在 可 以 实现 解释 器 了 。 除 最 简单 的 分 支 情况 外 ， 其 它 代码 均 需 要 重新 考虑 : 


(define (interp [expr : ExprC] [env : Env] [fds : (listof FunDefCc)]) : number 
(type-case ExprC expr 
[numC (n) n] 
<idC-case> ;标识 符 子 句 
<appC-case> ;调用 子 句 
<plusCc/multC-case>)) ;加 法 乘法 子 幼 


算术 操作 是 最 好 写 的 。 回 忆 一 下 ， 递 归 中 未 涉及 到 新 的 蔡 换 ， 因 此 无 需 特别 处 理 ， 环 境 不 会 
发 生 改 变 : 


<plusC/multC-case> ::= ;加 法 来 法 子 句 


[plusC (1 r) (+ (interp 1 env fds) (interp r env fds))] 
[multC (1 r) (* (interp 1 env fds) (interp r env fds))] 


接 下 来 我 们 处 理 标识 符 。 显 然 ， 现 在 遇 到 标识 符 不 应 该 直接 报错 了 。 我 们 应 该 在 当前 环境 中 
查找 对 应 的 值 : 


<idC-case> ::= ;标识 符 子 句 


[idc (n) (lookup n env)] 


马 


思考 题 


C 


实现 lookup 亏 数 。 


最 后 ， 处 理 兄 数 调用 。 注 意 到 在 替换 模型 的 解释 器 中 ， 唯 一 创建 新 替换 的 部 分 就 是 函数 调 
用 。 因 此 这 个 地 方 会 是 需要 创建 绑 定 的 地 方 。 第 一 步 ， 跟 之 前 一 样 ， 提 取 函 数 定义 : 


aDpC CdSe 的 用 村 广 


[appCc (f a) (local ([define fd (get-fundef f fds)]) 
<appC-interp>)] ;调用 的 解释 


之 前 ， 我 们 是 先进 行 蔡 换 ， 然 后 解释 。 现 在 剔除 掉 替 换 这 个 步骤 ， 我 们 首先 记录 下 要 替换 的 
东西 ， 然 后 直接 进入 解释 步骤 : 
<appC-interp> ::= ;调用 的 解释 


(interp (fdC-body fd) 
<appC-interp-bind-in-env> ;调用 的 解释 ， 环 境 绑 定 
fds) 


也 就 是 说 ， 函 数 定义 部 分 保持 不 变 ; 我 们 照 昌 解释 函数 的 主体 部 分 ; 不 过 解释 过 程 要 被 放 在 


半分 
新 的 环境 中 ， 该 环境 包含 了 函数 形式 参数 的 绑 定 。 接 下 来 定义 绑 定 过 程 : 


<appC-interp-bind-in-env-take-1> ::= ;调用 的 解释 ， 环 境 绑 定 ， 第 一 次 尝试 


(extend-env (bind (fdc-arg fd) 
(interp a env fds)) 
env) 


要 绑 定 的 是 形 参 〈 之 前 被 替换 的 也 是 形 参 ) 。 绑 定 的 值 是 函数 参数 解释 求 值 的 结果 ( 因为 我 
们 采取 及 早 求 值 语义 ) 。 这 就 需要 扩充 我 们 的 环境 。 类 型 检查 确保 我 们 得 到 的 代码 是 正确 
的 。 


最 后 加 上 |ookup 元 数 的 实现 ， 一 切 就 都 完成 了 : 


(define (lookup [for : symbol] [env : Env]) : number 
(cond 
[(empty? env) (error 'lookup "name not found")]  ; 找 不 到 名 称 
[else (cond 
[(symbol=? for (bind-name (first env))) 
(bind-val (first env))] 
[else (lookup for (rest env))])])) 


请 注意 ， 查 找 自由 标识 符 时 依旧 会 报错 ， 但 是 这 一 步 从 解释 器 中 被 剥离 出 来 一 一 解释 器 并 无 
法 判断 某 个 标识 符 是 否 被 绑 定 一 由 lookup 函 数 根 据 当 前 环境 来 决定 。 


完成 解释 器 后 ， 当 然 需要 测试 以 确保 其 正确 性 。 下 面 这 几 个 测试 都 通过 了 : 


(test (interp (plusC (numC 10) (appC "const5 (numC 10))) 
mt-env 
(list (fdC 'const5 '_ (numC 5)))) 
15) 
(test (interp (plusC (numC 10) (appC 'double (plusC (numC 1) (numC 2)))) 
mt-env 
(list (fdc 'double 'x (plusC (idCc 'x) (idc 'x))))) 
16) 
(test (interp (plusC (numC 10) (appC 'quadruple (plusC (numC 1) (numC 2)))) 
mt-env 
(list (fdc 'quadruple 'x (appC 'double (appC 'double (idc 'x)))) 
(fdc 'double 'x (plusC (idC 'x) (idc 'x))))) 
22) 


所 以 ， 我 们 是 已 经 完成 任务 了 ， 对 吧 ? 
思考 是 
找 找 看 bug 在 哪 。 


6.3 正确 的 进行 延迟 求 值 
考虑 下 面 这 个 测试 : 


(interp (appC 'f1i (numC 3)) 
mt-env 
(list (fdc 'f1i 'x (appC 'f2 (numC 4))) 
(fdc 'f2 'y (plusc (idC 'x) (idc 'y))))) 


在 我 们 的 解释 器 中 ， 它 的 结果 为 7。 这 正确 吗 ? 
将 这 个 测试 转换 成 Racket 人 代码， 两 个 定义 加 一 个 表达 式 : 


(define (fi x) (f2 4)) 
(define (f2 y) (+ x y)) 


(f1 3) 
考虑 其 求 值 过 程 。 (f1 3) 将 函数 f1 的 函数 体 中 x 替换 为 3， 于 是 下 一 步 处 理 (f2 4) 。 但 是 
注意 到 在 函数 f2 中 ， 标 识 符 x 未 绑 定 ! 当然 Racket 报 错 了 。 

事实 上 ， 我 们 的 替换 模型 解释 器 也 会 报错 ! 


为 什么 我 们 的 替换 模型 会 报错 呢 ? 这 是 因为 ， 我 们 仅 会 在 fl 的 函数 体内 将 标识 符 x 替换 为 
数 3 的 表示 。 【注释 】 (这 是 显而易见 的 事 : x 是 f1 的 参数 ; 如 果 其 它 函 数 的 参数 名 碰巧 也 
叫 x ， 那 也 是 个 不 同 的 x ) 。 当 我 们 计算 f2 时 ， 其 中 x 没有 被 蔡 换 过 ， 因 此 报错 了 。 


“ 数 3 的 表示 ?" 听 上 去 是 不 是 很 罗 唆 ? 以 后 这 类 情况 我 就 直接 说 “3" 了 ， 不 过 请 你 理解 这 其 中 
的 区 别 。 


那么 我 们 环境 模型 的 问题 到 底 出 在 哪 呢 ? 请 仔细 观察 ， 这 一 点 很 微妙 。 只 有 函数 调用 过 程 会 
改变 环境 ， 我 们 重点 观察 这 一 步 。 将 形 参 替换 成 实 参 是 通过 扩展 当前 环境 实现 的 。 在 我 们 的 
例子 中 ， 在 处 理 f2 函数 体 时 ， 我 们 不 仅 要 求 它 对 f2 的 参数 进行 替换 ， 还 要 它 对 当前 所 有 环 
境 中 的 参数 (也 就 是 调用 f2 的 f1 的 参数 ) 都 进行 替换 。 如 果 还 有 上 一 层 ， 它 的 参数 也 会 被 
替换 。 换 一 种 说 法 ， 添 加 到 环境 中 的 绑 定 只 增 不 减 。 


由 于 前 面 说 过 ， 环 境 模型 是 替换 模型 的 蔡 代 实现 策略 一 -我们 的 语言 意义 不 应 该 发 生 改 变 
一 一 唯一 合理 的 做 法 是 修改 解释 器 。 具 体 来 说 ， 我 们 不 应 该 让 解释 过 程 携带 所 有 历史 绑 定 ， 
而 应 为 每 个 函数 创建 干净 的 环境 ， 类 似 替 换 模型 的 做 法 。 很 容易 实现 : 


<appC-interp-bind-in-env> ::= ;调用 的 解释 ， 环 境 绑 定 
(extend-env (bind (fdc-arg fd) 


(interp a env fds)) 
mt-env) 


到 此 ， 我 们 重 现 了 替换 模型 解释 器 的 行为 。 


对 于 需要 报错 的 情况 ， 测 试 该 怎么 写 呢 ? 请 查阅 test/exn 的 文档 。 


6.4 作用 域 


上 面 那 个 错误 的 环境 模型 解释 器 ， 所 实现 的 语义 被 称 为 动态 作用 域 (dynamic scope) 。 它 
意味 着 随 着 程序 的 执行 ， 环 境 中 的 绑 定 不 断 增 加 。 于 是 ， 某 个 标识 符 是 否 被 绑 定 取决 于 程序 
的 执行 历史 。 这 应 该 被 视 作 程序 语言 设计 的 缺陷 。 它 增加 了 所 有 相关 工具 的 复杂 度 ， 如 编译 
器 、IDE， 也 使 得 其 代码 难于 阅读 维护 。 


与 之 对 应 的 ， 替 换 模型 ， 以 及 上 面 正 确实 现 的 环境 模型 ， 给 我 们 带 来 的 是 词法 作用 域 
(lexical scope) 或 称 静 态 作用 域 (static scope) 。 这 Nlexical) " 指 的 是 “通过 源 
码 即 可 确定 "; “静态 (static) " 指 的 是 “不 需 运行 程序 即 可 确定 "， 在 这 里 ， 这 两 者 指 代 的 意义 
相同 。 当 遇 到 标识 符 时 ， 我 们 希望 知道 两 件 事 : 


1， 它 是 否 被 绑 定 了 ? 
2.， 如 果 被 缚 定 ， 在 何 处 被 绑 定 的 ? 


这 里 “ 何 处 被 绑 定 ? 指 的 是 当 程 序 中 某 个 名 字 在 多 处 被 绑 定 ， 当 前 这 个 名 字 对 应 于 哪个 绑 定 。 换 
一 种 说 法 ， 那 个 绑 定 负责 当前 标识 符 的 绑 定 ? 一 般 来 说 ， 在 动态 作用 域 的 语言 中 ， 这 种 问题 
没有 静态 的 答案 ; 于 是 你 的 IDE 没 法 提示 你 某 个 变量 是 在 哪个 地 方 被 定义 的 (DrRacket 可 以 通 
过 画 箭头 的 方式 提示 此 类 信息 ) 。【 注 释 】 因 此 ， 随 着 命名 空间 变 得 更 为 复杂 (比如 引入 对 
象 、 线 程 等 概念 ) ， 我 们 仍 需 努力 维护 静态 作用 域 原则 。 


四 


考 这 个 问题 的 另 一 种 方法 是 ， 在 动态 作用 域 的 语言 中 ， 所 有 变量 的 绑 定 位 置 都 没 法 静 
ss ， 它 总 是 取决 于 动态 的 环境 。 换 一 种 说 法 ， 这 种 信息 毫 无 价值 。 


6.4.1 动态 作用 域 到 底 有 多 糟糕 
可 能 看 到 上 述 的 例子 ， 你 会 觉得 这 是 小 题 大 作 。 但 是 ， 请 考虑 这 两 件 事 : 


， 要 监 正 理解 动态 作用 域 的 程序 ， 你 必需 阅读 整个 程序 。 不 管 你 怎么 将 程序 进行 解 看 成 匈 
于 理解 的 小 的 部 分 ， 如 果 程 序 中 有 个 自由 变量 呢 。 

2， 要 理解 绑 定 关系 ， 其 复杂 度 不 仅 涉及 到 程序 的 体积 ， 还 牵扯 到 控制 流 的 复杂 度 。 考 虑 使 
用 了 很 多 回调 的 交互 式 程序 ， 你 需要 追踪 整个 调用 过 程 来 确定 某 个 标识 符 的 值 的 来 源 。 


还 不 够 有 说 服 力 ?让 我 们 把 示例 程序 中 的 表达 式 替换 为 : 


(if (moon-visible?) 
(f1 10) 
(f2 10)) 


假设 moon-visible? 函数 在 新 月 的 夜晚 其 值 为 假 ， 其 他 情况 下 为 路 。 于 是 我 们 的 程序 应 当 在 新 
月 夜晚 报错 ， 未 绑 定 变量 ， 而 在 其 他 情况 下 返回 某 个 值 。 
练习 


在 多 云 的 夜晚 呢 ? 


6.4.2 全 局 作用 域 


当 我 们 深入 思考 很 多 语言 中 全 局 的 定义 时 ， 事 情 会 变 得 更 加 复杂 。 例 如 ， 一 些 版 本 的 
A On cn 


(define y 1) 
(define (f x) (+ x y)) 


看 上 去 好 像 函 数 f 中 的 y 来 源 很 清晰 ， 不 过 : 


(define y 1) 
(define (f x) (+ x y)) 
(define y 2) 


是 合法 的 ， 且 计算 (f 16) 时 它 返 回 12。 你 可 能 会 想 ， 那 么 取 最 后 一 个 定义 就 对 了 1 。 但 


HW 


(define y 1) 
(define f (let ((z y)) (lambda (x) (+ x y z)))) 
(define y 2) 


这 时 候 ，z 绑 定 的 是 第 一 个 y 的 值 ，lambda 函 数 内 部 的 y 被 绑 定 为 第 二 个 y 的 值 。【 注 
释 】 事 实 上 可 以 通过 词法 作用 域 解释 这 种 行为 ， 但 是 它 让 情况 变 得 异常 复杂 ， 可 能 避免 这 样 
的 重 定义 是 一 种 比较 好 的 选择 。Racket 正 是 这 样 做 的 〈 在 Racket 中 这 么 操作 会 导致 报错 ) ， 


它 能 提供 用 户 全 局 定义 ， 同 时 又 避免 这 类 麻烦 事 。 
很 多 “脚本 ”语言 都 有 类 似 的 问题 。 所 以 网 上 你 会 看 到 很 多 人 搞 不 清楚 某 种 语言 到 底 是 静态 
还 是 动态 作用 域 的 。 0 PAN 是 在 比较 函数 内 的 行为 〈 通 常 是 静态 作用 
域 ) 还 是 全 局 的 行为 (通常 是 动态 作用 域 ) 。 请 注意 这 一 点 。 


6.5 暴露 环境 


如 果 是 实现 供 别人 使 用 的 解释 器 ， 明 智 的 选择 是 将 环境 隐藏 起 来 ， 给 用 户 提 供 的 接口 只 接收 
一 个 表达 式 ， 外 加 一 系列 函数 定义 ， 然 后 我 们 在 程序 内 部 从 空白 的 环境 开始 调用 interp。 这 样 
即 不 用 将 实现 细节 暴露 给 用 户 ， 也 不 会 由 于 用 户 提供 错误 的 环境 导致 问题 。 然 而 ， 有 些 情 况 

下 ， 暴 露 环 境 参 数 也 是 有 用 的 。 比 如 如 果 语 言 希 望 默认 绑 定 一 系列 值 :比如 说 ， 将 pi 绑 定 到 
3.2 (Indiana) 。 


7 任意 位 置 的 函数 


Scheme 语言 报告 修订 版 报告 的 概述 (r6rs 概述 ，r5rs (中 文 ) ) 中 指出 如 下 的 设计 原则 : 


程序 语言 的 设计 不 应 该 是 特性 的 简单 堆砌 ， 而 应 消除 语言 的 弱点 和 缺陷 ， 使 得 剩 下 的 特 
性 显得 必要 。 


这 是 个 无 须 争 辩 的 设计 原则 。 (当然 有 些 缺 陷 是 迫不得已 的 ， 但 是 此 原则 迫使 我 们 去 认 引 思 
考 引 入 这 些 缺 陷 的 必要 性 ， 而 不 是 把 它们 当 作 理所当然 的 。) 下 面 我 们 试 着 遵从 该 原则 来 引 
入 函数 。 


在 第 五 章 中 我 们 引入 函数 时 并 没有 特别 指明 函数 定义 所 在 的 位 置 。 可 以 说 我 们 是 按照 理想 化 
的 DrRacket 模 型 引入 的 函数 ， 即 将 函数 的 定义 和 使 用 分 离 。 下 面 我 们 使 用 Scheme 的 设计 原则 
来 重新 思考 一 下 这 种 设计 的 必要 性 。 


为 什么 函数 的 定义 不 可 以 也 是 一 种 表达 式 呢 ? 我 们 现在 实现 的 算术 语言 中 有 个 趣 远 的 问 

题 :“ 函 数 的 定义 表示 的 是 什么 值 ?”， 在 现 有 设计 中 没有 很 好 的 答案 。 对 于 丨 正 的 语言 来 说 ， 
计算 结果 当然 不 可 能 只 有 数 ， 所 以 也 没 必要 给 我 们 的 语言 作出 这 种 限制 ; 跳出 这 个 框框 ， 便 
可 以 给 出 很 好 的 回答 :“ 阴 数值 *。 让 我 们 试 试 如 何 实现 它 。 


将 函数 作为 值 ， 能 用 它 做 什么 呢 ? 显然 ， 函 数 和 数 是 不 同类 型 的 值 ， 你 不 能 对 函数 做 加 法 运 
算 。 但 是 ， 有 件 它 显 然 能 做 的 事 : 传 入 参数 调用 它 ! 因此 我 们 应 该 允许 函数 值 出 现在 函数 调 
用 那个 位 置 。 其 行为 ， 显 然 是 调用 该 函数 。 因 此 ， 我 们 的 语言 中 应 该 允许 如 下 的 表达 式 作 为 
合法 程序 (这 里 使 用 方 括号 以 方便 阅读 ) 


(+ 2 ([define (f x) (* x 3)] 4)) 


计算 它 得 到 (+ 2 (* 4 3)) ， 也 就 是 14 。 (注意 到 没 ? 这 里 使 用 了 替换 计算 模型 。) 


7.1 部 数 作为 表达 式 和 值 
首先 在 我 们 的 核心 语言 中 添加 函数 定义 : 


<expr-type> ::= ;表达 式 类 型 


(define-type Exprc 
[numC (n : number)] 
[idc (s : Symbol)] 
<app-type> ;调用 类 型 
[pluscC (1 : ExprC) (r : Exprc)] 
[multC (1 : ExprC) (r : Exprc)] 
<fun-type>) ;函数 类 型 


现在 ， 我 们 简单 把 函数 定义 复制 到 表达 式 语言 中 ， 以 后 需要 的 话 还 可 以 修改 这 一 点 。 这 样 做 
我 们 现在 可 以 复 用 已 有 的 测试 案例 。 


<fun-type-take-1> ::= ;函数 类 型 ， 第 一 次 尝试 


[fdc (name : symbol) (arg : Symbol) (body : ExprcC)] 


接 下 来 确定 函数 调用 是 什么 样 的 。 函 数 的 位 置 应 该 放 什 么 呢 ? 我 们 希望 它 可 以 是 函数 定义 ， 
而 不 是 像 之 前 那样 只 能 是 定义 好 的 函数 的 名 字 。 由 于 现在 函数 定义 类 型 和 其 它 表 达 式 类 型 混 
在 了 一 起 ， 这 里 让 元 数 的 位 置 可 以 放任 意 表 达 式 吧 ， 但 是 需要 记 住 我 们 其 实 只 希望 它 为 函数 
定义 : 


<app-type> ::= ;调用 类 型 


[appC (fun : Exprc) (arg : ExprcC)] 
另 一 种 可 以 考虑 的 做 法 是 ， 把 函数 定义 和 其 他 类 型 的 表达 式 区 分 开 。 也 就 是 定义 不 同类 
型 的 表达 式 。 我 们 在 后 文学 习 类 型 时 会 考虑 这 种 做 法 。 


有 了 这 个 定义 后 ， 我 们 不 再 需要 通过 名 字 查 找 函 数 了 ， 所 以 我 们 的 解释 器 也 可 以 不 用 再 传 入 
函数 定义 链表 。 当 然 之 后 有 需要 我 们 还 可 以 将 预定 义 函 数 链表 加 回来 ， 现 在 我 们 只 探究 即时 
函数 一 一 在 函数 调用 处 定义 的 函数 。 


接 下 来 修改 解释 器 interp 。 需 要 添加 子 名 来 处 理 函 数 定义 ， 该 部 分 代码 大 致 会 是 这 样 : 


[fdc (n a b) expr] 


解释 器 中 添加 了 该 语句 会 导致 什么 ? 
显然 ， 这 是 爆炸 性 的 改变 : 解释 器 不 再 总 是 返回 数 了 ， 于 是 出 现 类 型 错误 。 


在 之 前 解释 器 实现 过 程 中 ， 也 不 时 的 需要 注意 其 返回 值 类 型 ， 但 并 没 专门 给 其 定义 数据 类 
型 。 现 在 是 时 候 需 要 这 么 做 了 : 


<answer-type-take-1> ::= ;返回 值 类 型 ， 第 一 次 尝试 


(define-type Value 
[numv (n : number)] 
[funV (name : Symbol) (arg : Symbol) (body : ExprCc)]) 


我 们 使 用 后 级 v 表示 值 (value) ， 即 求 值 的 结果 。 funv 部 分 正 对 应 fdc ; fdc 为 输 
入 ， funv 为 输出 。 通 过 区 分 这 两 者 类 型 ， 我 们 可 以 分 别 修正 它们 两 个 。 


下 面 我 们 尝试 使 用 该 输出 类 型 重 写 解释 器 ， 从 类 型 开始 : 


<interp-hof> ::= ;解释 器 ， 高 阶 函 数 


(define (interp [expr : ExprC] [env : Env]) : Value 
(type-case ExprC expr 
<interp-body-hof>)) ;解释 器 主体 ， 高 阶 函数 


O 


这 就 要 求 我 们 同样 修改 Binding 和 辅助 函 数 lookup 的 类 


练习 


修改 Binding 和 辅助 函数 lookup 


<interp-body-hof> ::= ;解释 器 主体 ， 高 阶 函 数 


[numC (Nn) (numv n)] 

[idc (n) (lookup n env)] 
<app-case> ;调用 子 句 
<plus/mult-case> ;加 法 /乘法 子 儿 


<fun-case> ;， 函数 子 句 


对 于 数 ， 显 然 要 使 用 新 的 返回 值 类 型 构造 器 对 其 包 衰 一 下 。 对 于 标识 符 ， 一 切 不 变 。 对 于 加 


法 了 乘法， 需要 进行 简单 的 修改 使 其 能 正确 的 返回 value 类 型 而 不 是 简单 的 数 : 


<plus/mult-case> ::= ;加 法 /乘法 子 儿 


[plusC (1 r) (num+ (interp 1 env) (interp r env))] 
[multC (1 r) (num* (interp 1 env) (interp r env))] 


辅助 函数 num+ 和 num* 我 们 以 其 中 一 个 为 例 


(define (num+ [1 : Value] [r : Value]) : Value 


(cond 
[(and (numV? 1) (numv? r)) 
(numV (+ (numV-n 1) (numV-n r)))] 
[else 
(error 


'num+ "one argument was not a number")])) ;有 参数 不 是 数 


二 以 


请 留意 ， 在 实际 做 加 法 前 ， 我 们 检查 了 参数 的 类 型 确定 其 为 数 。 后 面 会 有 章节 继续 谈 
文 个 主题 。 


还 有 两 段 代 码 要 完成 。 先 是 函数 定义 。 上 面 说 过 ， 函 数值 就 是 其 类 型 的 数据 : 


第 一 次 尝试 


<fun-case-take-1> ::= ;部 数 子 钙 ， 第 


[fdc (n a b) (funVv n a b)] 


ds 。 尽 管 我 们 不 再 需要 从 函数 定义 链表 中 查询 函 
留 之 前 函数 调用 的 代码 的 结构 : 


<app-case-take-1> ::= ;调用 子 句 ， 第 一 次 尝试 
[appCc (f a) (local ([define fd f]) 
(interp (fdc-body fd) 
(extend-env (bind (fdc-arg fd) 
(interp a env)) 
mt-env)))] 


在 原来 是 lookup 查 找 的 地 方 ， 我 们 直接 引用 了 f 作为 函数 定义 。 注 意 由 于 在 函数 应 该 出 现 的 
位 置 事实 上 可 能 出 现任 何 表达 式 ， 我 们 最 好 编码 检测 它 是 否 实 是 函数 。 


这 里 “是 "是 什么 意思 呢 ?我们 是 要 检查 它 是 作为 语法 结构 上 的 函数 ( 即 fdc 构造 ) ， 还 
是 只 是 检查 该 表达 式 的 计算 结果 是 否 是 函数 值 ( 即 funv ) 呢 ? 这 两 种 做 法 有 什么 区 别 ? 
换 一 种 说 法 ， 你 能 不 能 找 出 具体 的 例子 来 展示 其 区 别 ? 


我 们 面临 选择 

el eae 

2， 对 其 进行 求 值 ， 然 后 检查 其 返回 值 是 否 是 函数 ， 如 果 不 是 ， 抛 出 弄 常 。 

我 们 选择 后 一 种 做 法 ， 它 会 使 得 我 们 的 语言 更 为 灵活 。 即 使 我 们 人 类 不 一 定 需要 这 么 做 ， 但 

ee es 
功能 ， 就 在 匿名 之 上 的 语法 糖 的 讨论 中 。 于 是 ， 修 改 函 数 调 用 部 分 代码 得 到 : 


<app-case-take-2> ::= ;调用 子 忽 ， 第 二 次 尝试 


[appCc (f a) (local ([define fd (interp f env)]) 
(interp (funV-body fd) 
(extend-env (bind (funV-arg fd) 
(interp a env)) 
mt-env)))] 


练习 
修改 代码 实现 两 种 不 同方 式 的 类 型 检查 。 


信 不 信 由 你 ， 到 此 为 止 ， 一 个 可 运行 的 解释 器 又 完成 了 。 最 后 我 们 照旧 给 出 两 个 测试 案例 : 


(test (interp (plusC (numC 10) (appC (fdC 'const5 '_ (numC 5)) (numC 10))) 


mt-env) 
(numV 15)) 
(test/exn (interp (appC (fdc 'f1 'x (appC (fdc 'f2 'y (plusc (idc 'x) (idc 'y))) 
(numC 4))) 
(numC 3)) 
mt-env) 


"name not found") 


7.2 什么 ?了 峡 套 ? 


函数 定义 的 函数 体 部 分 可 以 是 任意 表达 式 。 而 函数 定义 本 身 也 是 表达 式 。 于 是 函数 定义 中 可 
以 包含 … 函 数 定 义 。 例 如 : 


<nested-fdc> ::= ; 谋 套 的 fdC 
(fdc 'f1 'x 
(fdc 'f2 'x 


(pluscC (idC 'x) (idc 'x)))) 


对 它 求 值 还 不 是 特别 有 意思 : 


(funV 'f1 'x (fdc 'f2 'x (plusc (idc 'x) (idc 'x)))) 


当时 如 果 我 们 调用 上 面 的 函数 : 


<applied-nested-fdCc> ::= ;调用 谋 套 的 fdC 


(appC <nested-fdc> 
(numC 4)) 


再 求 值 ， 结 果 就 有 点 意思 了 : 
(funV 'f2 'x (plusCc (idC 'x) (idc 'x))) 
这 个 结果 就 好 像 外 部 函数 的 调用 对 内 部 的 函数 没有 任何 影响 一 样 。 那 么 ， 为 什么 应 该 是 这 样 


的 呢 ? 外 部 元 数 引入 的 参数 被 内 部 函数 引入 的 同名 参数 覆盖 (mask) 了 ， 此 进 信 各 志 作用 
域 (必须 的 ) 的 规则 ， 内 部 的 参数 应 该 覆盖 外 部 参数 。 但 是 ， 我 们 看 看 下 面 这 个 程序 : 


(appC (fdC 'f1i 'x 
(fdC 'f2 'y 
(pluscC (idc 'x) (idc 'y)))) 
(numC 4)) 


求 值得 到 : 


(funV 'f2 'y (plusC (idc 'x) (idC 'y))) 


咽 ， 有 点 意思 。 
想 想 有 意思 的 点 在 哪 ? 


NEN 


为 了 看 看 到 底 有 意思 在 哪 ， 我 们 调用 一 下 该 函数 : 


(appC (appC (fdCc 'f1i 'x 
(face fF29Y 
(pluscC (idc 'x) (idc 'y)))) 
(numC 4)) 
(numC 5)) 


它 将 抛 出 异常 告诉 我 们 没 找 到 标识 符 x 绑 定 的 值 ! 


但 是 ， 它 不 是 应 该 通过 函数 f1 的 调用 被 绑 定 吗 ? 清晰 起 见 ， 我 们 切换 为 (假定 的 ) Racket 语 
法 ” 
((define (f1 x) 
((define (f2 y) 
(GEExXY)) 


4)) 
5) 


在 调用 外 层 函 数 时 ，x 应 该 被 替换 成 5， 结 果 是 : 


((define (f2 y) 


(+ 5 y)) 
4) 


续 调用 、 替 换 得 到 (+ 5 4) 也 就 是 9 ， 并 没有 出 错 。 


换 一 种 说 法 ， 我 们 肯定 是 某 个 地 方 做 错 了 以 至 于 没有 捕捉 到 函数 调用 时 的 参数 替换 。【 注 
释 】 函 数值 需要 记 住 调用 过 程 中 执行 的 替换 操作 。 由 于 我 们 使 用 环境 来 表示 这 种 替换 ， 因 此 
函数 值 需要 包含 记录 了 该 替换 的 环境 。 这 样 得 到 的 数据 结构 称 为 用 包 《〈closure) 


另 一 方面 ， 如 果 我 们 使 用 替换 模型 ， x 会 被 (numV 4) ， 部 数 体 就 变 
并 没有 合适 的 类 型 。 换 一 种 说 法 ， 替 换 模型 假设 返 


成 (plusC (numv 5) (idc 'y)) ， 而 它 
党 该 假设 也 能 学 习 很 多 高 级 编程 概念 ， 只 是 我 们 不 打算 


回 值 的 类 型 是 合法 语法 。 其 实意 
往 这 个 方向 继续 讨论 


注意 一 下 2 在 解释 器 的 appC 子 句 中 用 到 了 funV-arg 和 funV-body ， 但 是 没 用 

到 funv-name 。 想 一 下 我 们 之 前 为 什么 需要 名 字 这 种 东西 ? 因为 需要 通过 名 字 找 到 函数 。 但 
是 这 里 我 们 通过 解释 器 找到 函数 ， 函 数 名 只 是 作为 描述 性 的 存在 罢了 。 换 一 种 说 法 ， 函 数 并 
不 需要 名 字 ， 就 跟 常 数 一 样 : 我 们 每 次 使 用 3 的 时 候 并 不 需要 给 它 命名 ， 那 么 对 于 函数 为 什么 
要 呢 ? 函数 本 质 上 是 匿名 的 ， 我 们 也 应 该 将 其 定义 和 命名 分 开 来 。 


(但 是 你 可 能 会 说 ， 这 种 论点 只 在 函数 直接 定义 并 使 用 的 情况 才 成 立 。 如 果 我 们 想 在 菜 个 地 
方 定义 ， 然 后 在 其 它 地 方 使 用 它 ， 我 们 不 还 是 需要 名 字 的 么 ? 是 的 ， 正 是 ， 后 面 的 匿名 之 上 
的 语法 糖 中 会 说 到 这 个 主题 ) 


~ 


7.3 实现 闭 包 


首先 将 部 数值 类 型 改 为 闭 包 结构 体 ， 而 不 仅仅 是 函数 本 体 : 


<answer-type> ::= ;返回 值 类 型 
(define-type Value 


[numv (n : number)] 
[closV (arg : Symbol) (body : ExprCc) (env : Env)]) 


同时 ， 我 们 可 以 修改 函数 类 型 ， 去 除 没 用 的 函数 名 部 分 。 由 于 历史 原因 ， 该 构造 被 称 
为 lambda : 


<fun-type> ::= ;有 函数 类 型 


[lamC (arg : Symbol) (body : Exprc)] 


现在 ， 当 解释 器 遇 到 函数 时 ， 需 要 记录 下 到 目前 为 止 进行 过 的 所 有 替换 : 【注释 】 


<fun-case> ::= ;元 数 子 句 


[lamC (a b) (closV a b env)] 


“Save the environment! Create a closure today!” 一 Cormac Flanagan 


然后 在 调用 部 数 时 ， 需 要 使 用 这 个 保存 下 来 的 环境 ， 而 不 是 空白 环境 。 


<app-case> ::= ;调用 子 句 
[appCc (f a) (local ([define f-value (interp f env)]) 
(interp (closV-body f-value) 
(extend-env (bind (closV-arg f-value) 


(interp a env)) 
(closV-env f-value))))] 


事实 上 这 段 代码 还 可 以 有 另 一 个 选择 : 使 用 函数 调用 处 的 环境 : 


[appC (f a) (local ([define f-value (interp f env)]) 
(interp (closV-body f-value) 
(extend-env (bind (closV-arg f-value) 
(interp a env)) 


env)))] 


思考 题 
如 果 我 们 使 用 动态 的 环境 ( 即 函 数 调用 处 的 环境 ) ， 会 导致 什么 ? 


回 过 头 来 看 ， 现 在 可 以 理解 为 何 我 们 在 解释 函数 体 时 使 用 空白 环境 了 。 如 果 函 数 是 定义 在 程 
序 顶层 的 ， 那 么 它 就 没有 “包含 "任何 的 标识 符 。 因 此 我 们 之 前 的 浮 数 实现 是 现在 这 种 的 特殊 情 
况 。 


7.4 再 次 聊 聊 替换 


已 经 看 到 ， 通 过 替换 这 种 非常 符合 直觉 的 方式 可 以 帮助 理解 如 何 实 现 lambda 函数 。 然 
， 对 于 替换 本 身 我 们 需要 小 心 一 些 陷 阱 ! 考虑 下 面 这 个 函数 (这 里 使 用 Racket 语 法 ) 


(lambda (f) 
(lambda (x) 
(f 19))) 


假设 f 被 蔡 换 为 lambda 表 达 式 (lambda (y) (+ x y)) 。 注意 这 里 有 个 自由 变量 x ， 所 以 如 果 
它 被 求 值 ， 我 们 应 该 会 得 到 未 绑 定 变量 错误 。 但 是 使 用 替换 模型 ， 我 们 将 得 到 : 


(lambda (x) 
((lambda (y) (+ x y)) 19)) 


自由 变量 消失 了 ! 


这 是 由 于 我 们 的 替换 操作 实现 的 太 过 简单 。 为 了 避免 这 种 异常 情况 〈 这 也 是 动态 绑 定 的 一 种 
形式 ) ， 我 们 需要 实现 非 捕获 型 的 替换 (capture-free substitution ) 。 大 致 来 说 它 是 这 样 工 
作 的 : 我 们 总 是 将 绑 定 标识 符 重 命名 为 从 未 用 过 的 (新鲜 的 ，fresh) 名 字 。 比 如 说 ， 我 们 给 
每 个 标识 符 加 个 数字 后 级 来 保证 不 会 出 现 重 名 : 


(lambda (f1) 
(lambda (x1) 
(f1 10))) 


(请 注意 ， 我 们 把 f 的 绑 定 和 被 绑 定 出 现 都 蔡 换 成 了 f1。) 接 下 来 对 被 蔡 换 的 表达 式 也 进行 同 
样 的 重 命名 


(lambda (y1) (+ x y1)) 


于 是 替换 f1 得 到 ; 【 注释】 


(lambda (x1) 
((lambda (y1) (+ x y1)) 10)) 


这 里 为 什么 不 对 作为 x 人 因为 它 可 能 是 引用 全 局 的 定义 ， ee 
局 定义 进行 同样 的 重 命名 。 这 就 是 所 谓 的 一 致 性 重 命名 原则 。 对 这 个 例子 来 说 ， 这 没 啥 
区 别 O 


现在 ，x 仍然 是 自由 变量 ! 这 才 是 正确 的 替换 方式 。 


等 一 等 。 怎 么 使 用 环境 模型 解释 器 处 理 这 个 例子 ， 后 果 是 哈 ? 


炒 
| 
炒 


试 一 下 。 
试 了 你 就 知道 ， 一 切 正确 : 程序 报告 有 未 绑 定 变量 。 环 境 模型 实际 上 实现 了 非 捕 获 型 替换 。 
练习 


使 用 环境 是 怎么 避免 替换 中 的 捕获 问题 的 ? 


7.5 匿名 之 上 的 语法 糖 


让 我 们 回 过 头 考虑 函数 命名 问题 ， 对 于 实际 编程 来 说 它 有 明显 的 价值 。 注 意 我 们 现在 已 经 有 
命名 东西 的 方法 : 通过 函数 的 调用 ， 参 数 的 值 和 参数 名 构成 了 局 部 绑 定 关系 。 在 函数 体 中 ， 
我 们 只 需要 用 形 参 就 可 以 引用 实 参 了 。 


所 以 说 ， 我 们 可 以 用 郊 数 来 给 一 系列 函数 定义 命名 。 例 如 ， 考 虑 Racket 代 码 : 


(define (double x) (+ x x)) 
(double 10) 


等 价 于 : 


(define double (lambda (x) (+ x x))) 
(double 10) 


一 种 方法 是 直接 内 联 (inline) double 的 定义 。 不 过 为 了 保留 命名 过 程 ， 我 们 让 其 等 价 于 : 


((lambda (double) 
(double 10)) 
(lambda (x) (+ x x))) 





这 种 模式 一 一 我 们 暂且 称 为 “left-left-lambda" 一 一 实际 上 是 种 局 部 命名 方式 。 它 非常 有 用 ， 以 
至 于 Racket 为 它 提 供 了 专门 的 语法 : 


(let ([double (lambda (x) (+ x x))]) 
(double 10)) 


let 可 以 通过 定义 成 上 面 那 种 语法 糖 来 实现 。 


下 面 是 个 稍微 复杂 点 的 例子 


(define (double x) (+ x x)) 
(define (quadruple x) (double (double x))) 
(quadruple 10) 


这 可 以 被 改写 成 : 


(let ([double (lambda (x) (+ x x))]) 
(let ([quadruple (lambda (x) (double (double x)))]) 
(quadruple 10))) 


一 切 正常 o 改变 一 下 顺序 就 不 行 了 


(let ([quadruple (lambda (x) (double (double x)))]) 
(let ([double (lambda (x) (+ x x))]) 
(quadruple 10))) 


这 是 由 于 quadruple 中 “看 不 见 ”double 。 这 里 我 们 也 能 看 到 全 局 绑 定 和 局 部 绑 定 的 区 别 : 位 
于 顶层 的 全 局 绑 定 有 “无 限 的 作用 域 "。 这 是 其 强大 的 地 方 也 是 问题 的 来 源 。 


下 面 还 有 个 更 为 微妙 的 问题 ， 和 递归 有 关 。 考 虑 如 下 的 简单 无 限 循环 程序 : 


(define (loop-forever x) (loop-forever x)) 
(loop-forever 10) 


转换 成 let 


(let ([loop-forever (lambda (x) (loop-forever x))]) 
(loop-forever 10)) 


看 上 去 好 像 没 毛病 ， 是 吧 ? 重 写成 lambda 的 形式 : 


((lambda (loop-forever) 
(loop-forever 10)) 
(lambda (x) (loop-forever x))) 


显然 ， 最 后 一 行 中 的 loop-forever 没有 被 绑 定 ! 


对 于 全 局 绑 定 这 个 问题 就 不 存在 o 该 怎么 理解 呢 ? 这 需要 我 们 理解 递归 的 含义 。 很 快 我 们 将 
揭 开 这 层 神秘 的 面纱 。 


8 可 变 结构 体 和 变量 


游戏 又 来 了 


下 列 各 表达 式 哪些 意义 相同 的 ? 


@ 并 二 三 二 全 
ee of=3 
@ f= 


假设 都 是 使 用 Java 书 写 。 第 一 个 和 第 三 个 的 意义 可 能 一 样 ， 也 可 能 和 第 二 个 相同 : 完全 取决 
于 f 是 局 域 标识 符 (比如 参数 ) 还 是 对 象 的 字段 (如 ， 作 为 this.f = 3 的 简写 ) 。 


不 管 是 哪 种 情况 ， 求 值 器 都 将 永久 改变 绑 定 到 f 的 值 。 这 对 其 他 观察 者 而 言 影响 很 大 。 到 目 
前 为 止 ， 我 们 实现 的 计算 过 程 对 于 相同 的 输入 总 是 给 出 相同 的 输出 。 现 在 计算 的 答案 还 取决 
于 它 在 何 时 进行 : 在 f 的 值 改 变 前 还 是 后 。 时 间 的 引入 对 于 代码 的 推理 有 深远 影响 。 


此 外 ， 上 述 简单 的 语法 包含 了 两 种 不 同 的 改变 : 改变 字段 的 值 ( o.f = 3 或 者 this.f = 3 ) 
和 改变 标识 符 的 值 ( f = 3 ， 其 中 f 在 方法 内 部 被 绑 定 而 不 是 由 对 象 绑 定 ) 有 着 非常 大 的 区 
别 。 我 们 会 依次 讨论 它们 。 首 先 探讨 字段 ， 再 在 变量 那 一 节 中 探讨 标识 符 。 


8.1 可 变 结构 体 


8.1.1 可 变 结 构 体 的 简化 模型 


很 快 我 们 会 带 大 家 认识 到 ， 对 象 其 实 就 是 一 般 化 的 结构 体 。 对 象 中 的 字段 可 认为 是 结构 体 中 
字段 的 一 般 化 的 结果 。 要 理解 赋值 ， 理 解 可 变 对 象 大 致 足够 了 (并 不 完全 足够 ) 。 为 了 简单 
起 见 ， 我 们 甚至 不 需要 结构 体 具 有 多 个 字段 : 一 个 字段 就 足够 了 。 我 们 称 该 结构 为 box。 在 
Racket 中 ，box 仅 支持 三 种 运算 : 


box : ('a -> (boxof 'a)) 
unbox : ((boxof 'a) -> 'a) 
set-box! : ((boxof 'a) 'a -> void) 


box 接受 一 个 值 ， 将 其 包 衰 在 可 变 容器 中 。 unbox 取出 容器 中 的 当前 值 。 set-box! 改变 容器 
中 的 值 ， 对 于 静态 类 型 的 语言 来 说 ， 新 值 需要 和 昌 值 保持 类 型 一 致 。 如 果 对 应 到 Java 中 的 

话 ，box 大 致 等 价 于 带 类 型 参数 的 Java 容 器 类 ， 只 有 一 个 字段 ， 外 加 getter 和 getter: box 对 应 
构造 器 ， unbox 对 应 getter ， set-box! 对 应 setter (由 于 只 有 一 个 字段 ， 所 以 字段 名 也 无 
所 谓 了 ) 


class Box<T> { 
private T the_value; 
Box(T V) { 
this.the_value = v; 


} 
woee( nt 
return the_value; 


} 

VoLdset(T ve 
the_value = v; 

} 


由 于 赋值 操作 经 常 成 组 进行 (例如 ， 从 银行 账户 中 取出 一 些 钱 存放 到 另 一 个 账户 中 ) ， 支 持 
赋值 操作 的 序列 将 非常 有 用 。 在 Racket 中 ， 你 可 以 使 用 begin 表示 操作 的 序列 ; 它 将 依次 计 
算 序 列 中 的 每 个 表达 式 然后 返回 最 后 一 个 的 求 值 结果 。 


练习 
尝试 使 用 let 对 pegin 去 语法 糖 (还 可 以 进一步 去 语法 糖 到 lambda ) 。 


尽管 可 以 将 begin 当 作 语法 糖 (从 核心 语言 中 ) 去 除 ， 但 是 它 对 理解 赋值 的 内 部 原理 非常 有 
用 。 因 此 我 们 还 是 决定 直接 在 核心 语言 中 支持 简单 的 begin ， 该 begin 形式 只 允许 两 个 子 
项 o 


这 也 说 明 ， 去 语法 糖 没有 绝对 的 规范 。 我 们 选择 在 核心 语言 中 加 上 这 个 构造 ， 而 它 并 不 
是 必须 的 。 如 果 我 们 的 目的 是 尽 可 能 减 小 解释 器 的 体积 一 一 即使 增 大 输入 程序 的 体积 也 
在 所 不 惜 一 那么 就 不 应 该 这 么 做 。 不 过 我 们 在 本 书 中 的 目的 是 学 习 (适合 教育 目的 
的 ) 解释 器 ， 那 么 选择 大 一 点 的 语言 更 加 有 指导 性 。 





8.1.2 脚手架 
首先 ， 扩 展 语言 的 核心 数据 类 型 : 


(define-type EXxprC 
[numc (n : number)] 
[idc (s : symbol)] 
[appC (fun : ExprC) (arg : ExprcC)] 
[plusCc (1 : ExprC) (r : ExprcC)] 
[multCc (1 : ExprC) (r : Exprc)] 
[lamC (arg : Symbol) (body : ExprcC)] 
[boxC (arg : Exprc)] 
[unboxC (arg : ExprcC)] 
[setboxC (b : ExprCc) (v : ExprcC)] 
[seqC (b1 : ExprC) (b2 : ExprC)]) ;序列 


O 


注意 setboxCc 表达 式 中 ， 两 个 操作 对 象 均 为 表达 式 值 (V) 为 表达 式 很 自然 ， 没 什么 奇怪 
的 ; 但 是 pox 参数 (b) 为 表达 式 的 话 年 一 看 还 挺 奇 怪 的 。 它 意 味 着 我 们 可 以 写 出 对 应 于 如 下 
Racket 代 码 的 程序 : 


(let ([bo (box 0)] 
[b1 (box 1)]) 
(let ([1 (list bo b1)]) 
(begin 
(set-box! (first 1) 1) 
(set-box! (second 1) 2) 
1))) 


其 计算 结果 为 box 的 链表 ， 第 一 个 box 包 含 的 值 为 1 ， 第 二 个 包含 的 值 为 2 。【 注 释 】 观 察 
程序 中 第 一 个 set-box! 指令 ， 其 第 一 个 参数 为 (first 1) ， 也 就 是 说 ， 是 计算 结果 为 box 的 
表达 式 ， 而 不 是 字面 的 box 也 不 是 标识 符 。 和 Java 中 下 列 代码 类 似 (放松 类 型 要 求 ) 


publrevstatle voadmaann (oeringhl arngsde 
Box<Integer> b0 = new Box<Integer>(0); 
Box<Integer> bi = new Box<Integer>(1); 


ArrayList<Box<Integer>> 1 = new ArrayList<Box<Integer>>(); 
1.add(bo); 
1.add(b1); 


1l.get(0).set(1); 
1l.get(1).set(2); 


输出 可 能 是 '(#81 #&2) 。 # 是 Racket 中 box 类 型 的 语法 缩写 形式 。 
注意 到 其 中 1.get(0) 为 复合 表达 式 ， 它 得 到 一 个 box 对 象 ， 然 后 调用 其 set 方法 。 
为 方便 起 见 ， 我 们 假设 已 经 实现 了 下 列 去 语法 糖 操作 : 


1. let 
2， 人 必要 的 话 ， 多 于 两 个 子 项 的 序列 〈 可 以 去 语法 糖 为 远 套 的 序列 ) 


有 时 我 们 还 会 直接 使 用 Racket 语 法 写 程序 ， 一 方面 是 为 了 简洁 (我 们 的 核心 语言 将 变 得 大 而 
策 重 ) ， 一 方面 方便 你 可 以 直接 在 Racket 中 运行 相关 代码 观察 结果 。 也 就 是 说 ， 我们 会 使 用 
Racket (大 部 分 主流 语言 中 可 变 对 象 和 结构 体 行为 都 与 之 类 似 ) 作为 我 们 实现 的 参照 。 


8.1.3 与 闭 包 的 交互 
考虑 如 下 的 简单 计数 器 : 


(define new-loc 
(let ([n (box 0)]) 
(lambda () 
(begin 
(set-box! n (add1 (unbox n))) 
(unbox n))))) 


每 次 调用 ， 它 都 会 返回 下 一 个 自然 数 : 


> (new-loc) 


- number 
db 
> (new-loc) 
- number 
2 
为 什么 会 这 样 呢 ? 这 是 因为 其 中 的 box 只 被 创建 了 一 次 ， 它 被 绑 定 到 了 n ， 然 后 该 绑 定 被 放 
进 闭 包 。 所 有 后 续 的 赋值 操作 改变 的 都 是 同一 个 box 。 如 果 交 换 两 行 代 码 ， 结 果 就 完全 不 同 
了 : 
(define new-loc-broken 
(lambda () 
(let ([n (box 0)]) 
(begin 


(set-box! n (add1 (unbox n))) 
(unbox n))))) 


运行 看 看 : 


> (new-loc-broken) 
- number 

1 

> (new-loc-broken) 
- number 

1 


这 种 情况 下 ， 每 次 调用 函数 都 会 创建 新 的 box ， 所 以 每 次 的 计算 结果 都 是 一 样 的 (尽管 程序 
内 部 也 变动 了 pox 的 值 ) 。 我 们 对 于 box 的 实现 也 应 该 正确 重 现 这 种 区 别 。 


上 面 的 例子 给 了 我 们 一 点 关于 实现 上 的 提醒 。 显 然 ， new-loc 的 闭 包 中 每 次 引用 的 必须 是 同 
se 六 都 是 不 同 的 ! 请 仔细 体 
会 : 它 从 词法 上 来 看 必须 是 相同 的 ， 但 是 动态 的 值 却 是 不 同 的 。 这 个 区 分 将 是 我 们 实现 的 核 


8.1.4 理解 box 的 解释 


首先 重 现 一 下 当前 的 解释 器 : 


<interp-take-1> ::= ;解释 器 ， 第 一 次 尝试 


(define (interp [expr : ExprCc] [env : Env]) : Value 
(type-case ExprC expr 
[numC (n) (numv n)] 
[idc (n) (lookup n env)] 
[appC (f a) (local ([define f-value (interp f env)]) 
(interp (closV-body f-value) 
(extend-env (bind (closV-arg f-value) 
(interp a env)) 
(closV-env f-value))))] 
[pluscC (1 r) (num+ (interp 1 env) (interp r env))] 
[multcC (1 r) (num* (interp 1 env) (interp r env))] 
[lamC (a b) (closV a b env)] 
<boxC-case> ;box 子 名 
<unboxC-case> ;unbox 子 句 
<SetboxC-case> ;setbox 子 名 
<seqC-case>)) ;序列 子 句 


由 于 引入 了 新 类 型 的 值 一 box， 我 们 需要 更 新 返回 值 的 数据 类 型 : 


<value-take-1> ::= ; 值 ， 第 一 次 尝试 


(define-type Value 
[numv (n : number)] ; 数 
[closV (arg : symbol) (body : Exprc) (env : Env)] ;i 闭 包 
[boxV (v : Value)]) 


先 实 现 两 种 简单 的 情形 。 对 于 box 表达 式 ， 直 接 求 值 并 使 用 boxv 包 庄 后 返回 : 
<boxC-case-take-1> ::= ;box 子 句 ， 第 一 次 尝试 
[boxC (a) (boxV (interp a env))] 
同样 ， 从 box 中 提取 值 也 很 简单 : 
<unboxC-case-take-1> ::= ;Unbox 子 句 ， 第 一 次 尝试 
[unboxC (a) (boxV-v (interp a env))] 
到 这 里 你 应 该 已 经 写 过 一 组 测试 ， 来 保证 新 加 代码 行为 同 预期 一 样 。 


当然 ， 现 在 还 没有 做 到 难 的 部 分 。 可 以 预见 ， 所 有 有 意思 的 行为 都 在 对 setboxc 的 处 理 上 。 
然而 ， 我 们 却 要 先 考 察 seqc (你 会 看 到 我 们 为 什么 把 它 加 到 核心 语言 中 ) 。 


先 试 试 二 目 序列 最 自然 的 实现 方式 : 
<seqC-case-take-1> ::= ;序列 子 句 ， 第 一 次 尝试 


[seqC (bi b2) (let ([v (interp bi env)]) 
(interp b2 env))] 


即 先 计算 第 一 个 子 项 ， 然 后 计算 第 二 个 子 项 并 返回 其 计算 结果 。 


你 应 当 迅 速 察 觉 到 一 些 问 题 ， 我 们 计算 了 第 一 个 子 项 并 把 它 的 值 绑 定 到 了 v ， 但 是 后 面 的 计 
算 过 程 中 没有 用 它 。 这 倒 没 关系 : 正常 来 说 ， 第 一 个 子 项 中 包含 了 某 种 赋值 操作 ， 其 返回 值 
没 啥 用 (确实 ， 注 意 set-box! 返回 void 值 ) 。 那 么 我 们 可 以 实现 如 下 : 


<seqC-case-take-2> ::= ;序列 子 句 ， 第 二 次 尝试 
[seqC (bi b2) (begin 


(interp b1 env) 
(interp b2 env))] 


这 种 实现 并 不 令 人 满意 ， 它 直接 使 用 了 Racket 中 的 序列 操作 (无 助 于 我 们 理解 ) ， 更 严重 的 

问题 是 ， 它 不 可 能 是 正确 的 ! 因为 ， 我 们 必须 要 把 赋值 操作 的 结果 存储 起 来 。 但 是 ， 我 们 的 

解释 器 只 能 求 出 表达 式 的 值 ， 任 何在 (interp bl env) 中 进行 的 赋值 操作 都 将 丢失 。 显 然 这 不 
是 我 们 想 要 的 。 


8.1.5 环境 能 帮 有 我 们 解决 问题 吗 ? 
下 面 这 个 例子 能 给 我 们 一 点 启示 : 


(let ([b (box 0)]) 
(begin (begin (set-box! b (+ 1 (unbox b))) 
(set-box! b (+ 1 (unbox b)))) 
(unbox b))) 


在 Racket 中 ， 它 求 值 得 2 。 
练习 
使 用 EXDnG 表示 该 表达 式 S 


考虑 内 层 的 begin 0 。 它 的 两 个 子 项 ( (set-box! ...) 的 Exprc 表示 ) 完全 相同 。 
然而 幕后 肯定 有 什么 肖 悄 改变 了 ， 因 为 box 中 的 值 会 从 0 变 成 2 ! 上 面 的 例子 修改 一 下 我 
们 能 "看 "得 更 清 站 


(let ([b (box 0)]) 
(+ (begin (set-box! b (+ 1 (unbox b))) 
(unbox b)) 
(begin (set-box! b (+ 1 (unbox b))) 
(unbox b)))) 


这 下 求 值 得 到 3。 这 里 ， 当 处 理 到 加 法 时 ， 需 要 对 两 个 操作 数 调用 两 次 interp ， 传 给 它们 的 
表达 式 是 完全 相同 的 。 然 而 ， 第 一 个 调用 的 行为 显然 会 被 第 二 个 调用 感知 到 。 我 们 需要 解 开 
背后 的 魔法 。 


如 果 给 解释 器 输入 了 两 个 一 模 一 样 的 表达 式 ， 它 返回 的 结果 怎么 会 不 一 样 呢 ? 最 简单 的 解 
释 ， 解 释 器 的 另 一 个 参数 ， 即 环境 ， 发 生 了 某 些 变化 。 我 们 现 有 的 解释 器 在 处 理 加 法 时 ， 对 
俩 个 操作 数 调用 interp 时 用 的 环境 是 一 样 的 ; 在 处 理 序列 时 ， 对 两 个 子 项 调用 interp 时 用 


的 环境 也 是 一 样 的 。 所 以 现 有 的 解释 器 ， 是 不 可 能 产生 我 们 想 要 的 结果 的 一 -相同 的 输入 总 
是 会 得 出 相同 的 输出 。 


上 述 例子 我 们 得 到 的 一 些 启示 : 


1， 多 次 调用 解释 器 ， 并 且 我 们 认为 其 返回 值 可 能 不 同 的 情况 下 ， 我 们 需要 确保 传递 给 解释 
器 的 参数 也 不 同 
2， 解 释 器 需要 返回 一 种 记录 ， 其 中 保存 了 求 值 过 程 中 进行 过 的 赋值 


由 于 输入 的 表达 式 不 可 能 改变 ， 所 以 第 一 条 指引 我 们 使 用 环境 来 反映 不 同调 用 之 间 的 不 同 。 
结合 第 二 点 我 们 很 自然 的 想到 让 解释 器 返回 环境 ， 然 后 可 以 将 它 传递 给 下 一 个 调用 。 于 是 ， 
大 致 来 说 解释 器 的 类 型 可 能 就 变 成 : 


; interp : ExprC * Env -> Value * Env 


即 ， 解 释 器 接收 表达 式 和 环境 作为 参数 ; 在 该 环境 中 求 值 ， 同时 求 值 过 程 中 更 新 环境 ; 计算 
完成 后 (和 以 前 一 样 ) 返回 求 值 结果 ， 同 时 还 返回 更 新 后 的 环境 。 新 的 环境 被 传 入 解释 器 的 
下 一 次 调用 中 。 setboxc 的 处 理 过 程 中 应 该 会 影响 到 环境 ， 以 反应 它 所 执行 的 赋值 操作 。 


在 着 手 实现 之 前 ， 我 们 应 先 考 虑 这 种 改变 的 后 果 。 环 境 已 经 负担 了 重任 : 保存 被 延迟 的 替换 
操作 的 所 需 的 信息 。 它 已 经 有 非常 明确 的 语义 一 一 由 替换 给 定 一 一 我 们 应 该 注意 ， 不 要 影响 
de a 
境 的 功能 ， 使 得 加 法 的 一 个 参数 分 支 中 的 绑 定 通过 它 可 以 传递 到 另 一 个 参数 分 支 中 ， 例 如 ， 
考虑 下 面 的 程序 : 


(+ (let ([b (box 9)]) 
1) 


b) 


显然 该 程序 将 报错 : 加 法 的 第 二 个 参数 b 是 未 绑 定 的 ( b 的 作用 域 终止 于 let 表达 式 的 终 
人 尔 来 说 不 够 清晰 ， 用 函数 把 let 语法 糖 去 除 ) 。 但 是 ， 如 果 扩 展 了 
环境 的 功能 ， 解释 完 和 一 个 参数 后 产生 的 环境 中 显然 包含 了 b 的 绑 定 信息 。 





练习 
尝试 使 用 已 有 的 解释 器 的 逻辑 运行 这 段 代 码 ， 以 确保 点 正 理 解 上 面 表达 的 意思 。 


当然 你 可 能 考虑 其 它 实现 方式 ， 不 过 它们 一 般 来 说 都 会 导致 类 似 的 失败 。 上 比如 你 可 能 会 想 ， 
由 于 问题 出 在 多 余 的 绑 定 上 ， 我 们 可 以 将 返回 的 环境 中 多 余 的 绑 定 直接 移 除 。 听 上 去 不 错 ， 
但 是 你 还 记得 我 们 还 需要 实现 闭 包 吗 ? 


练习 


考虑 如 下 程序 的 Expc 表示 : 


(let ([a (box 1)]) 
(Glee lambdan( (Ct uniox ony 
(begin 
(set-box! a 2) 
(F109)D) 


看 看 这 个 方案 有 哈 问 题 。 


要 认识 到 ， 前 面 提 到 的 两 个 启示 中 的 约束 都 是 有 效 的 ， 但 是 解决 方案 并 不 在 上 面 提出 的 这 些 
尝试 中 。 再 仔细 想 想 ， 那 两 个 启示 中 所 提出 的 约束 都 没 要 通过 环境 去 实现 。 而 且 环境 显然 也 
没 法 负 起 这 个 职责 。 


8.1.6 引入 贮存 


通过 上 一 节 的 讨论 ， 我 们 意识 到 需要 额外 的 仓库 来 记录 表达 式 的 解释 过 程 。 仓 库 之 一 是 环 

境 ， 还 是 执行 本 来 赋予 它 的 职责 ， 维 护 词法 作用 域 。 但 是 环境 不 能 直接 将 标识 符 映 射 到 值 ， 
因为 现在 值 是 可 能 会 变 的 。 也 即 ， 我 们 需要 额外 的 东西 用 于 维护 可 变 box 的 动态 状态 ， 这 个 
额外 的 东西 被 称 之 为 贮存 (store) 。 


和 环境 一 样 ， 贮 存 也 是 映射 结构 。 它 的 值 域 可 以 是 任意 的 名 字 的 集合 ， 不 过 自然 的 想法 是 将 
其 想 作用 于 表示 内 存 地 址 的 数 。 这 是 因为 ， 在 语义 上 来 说 ， 存 储 就 对 应 于 (抽象 的 ) 计算 机 
的 物理 内 存 ， 而 传统 上 内 存 地 址 一 般 采 用 数 进行 寻 址 。 因 此 环境 是 将 名 字 映 射 到 地 址 ， 然 后 
贮存 将 地 址 映射 到 具体 的 值 。 


(define-type-alias Location number) ;地 址 


(define-type Binding  ， 绑 定 

[bind (name : Symbol) (val : Location)]) 
(define-type-alias Env (listof Binding)) ;环境 
(define mt-env empty) 
(define extend-env cons) 


(define-type Storage ;贮存 物 
[cell (location : Location) (val : Value)]) 


(define-type-alias Store (listof Storage)) ;贮存 


(define mt-store empty) ; 空 贮存 
(define override-store cons)  ; 禾 盖 贮存 


我 们 还 需要 提供 函数 用 于 在 贮存 中 查询 值 ， 就 跟 之 前 的 环境 一 样 (现在 环境 中 查询 的 结果 是 
地 址 了 ) 。 


(define (lookup [for : Symbol] [env : Env]) : Location 


(define (fetch [loc : Location] [sto : Store]) : Value 


有 了 这 些 ， 就 能 完成 解释 器 返回 值 的 正确 表示 了 : 


(define-type Value 
[numv (n : number)] 
[closv (arg : Symbol) (body : ExprC) (env : Env)] 
[boxV (1 : Location)]) 


练习 


完成 查询 函数 lookup 和 获取 有 函数 fetch 的 函数 体 部 分 。 


8.1.7 解释 器 之 解释 box 


现在 有 了 贮存 ， 环 境 可 以 返回 之 、 可 以 更 新 之 从 而 反映 求 值 过 程 中 的 赋值 ， 而且 赋值 本 身 不 
需要 修改 环境 中 的 内 容 。 由 于 函数 只 能 返回 一 个 值 ， 我 们 考虑 定义 一 个 数据 结构 用 于 存放 解 
释 器 的 返回 值 : 


(define-type Result  ; 结 
[v*s (v : Value) (s : Store)]) 


于 是 ， 解 释 器 的 类 型 变 成 了 这 样 : 


<interp-mut-struct> ::= ;解释 器 ， 可 变 结构 体 


(define (interp [expr : ExprCc] [env : Env] [sto : Store]) : Result 
<ms-numC-case> 
<ms-idC-case> 
<ms-appC-case> 
<ms-plusCc/multC-case> 
<ms-lamC-case> 
<ms-boxC-case> 
<ms-unboxC-case> 
<ms-setboxC-case> 
<ms-seqC-case>) 


数 的 解释 依然 是 最 简单 的 。 记 住 我 们 需要 返回 贮存 ， 该 贮存 反映 求 值 输入 表达 式 过 程 中 所 发 
生 的 全 部 赋值 。 由 于 数 是 常量 ， 求 值 过 程 不 会 有 赋值 发 生 ， 所 以 ， 直 接 返 回 传 入 的 贮存 即 
司 : 


<ms-numC-case> : := 


[numC (n) (v*s (numV n) sto)] 


创建 闭 包 也 是 一 样 ; 注意 是 闭 包 的 创建 而 不 是 调用 : 


<ms-lamC-case> ::= 


[lamC (a b) (v*s (closV a b env) sto)] 


标识 符 的 处 理 很 直接 。 当 然 如 果 你 的 实现 过 于 简单 ， 类 型 系统 会 告诉 你 错 在 哪里 : 为 了 获取 
返回 值 ， 你 即 要 查询 环境 也 要 查询 贮存 : 


<ms-idC-case> : := 


[idc (n) (v*s (fetch (lookup n env) sto) sto)] 
注意 到 lookup 和 fetch 组 合 在 一 起 完成 之 前 由 lookup 完成 的 工作 。 
接 下 来 的 事情 才 有 意思 呢 。 
考虑 序列 的 处 理 。 显 然 ， 我 们 需要 解释 两 个 子 项 : 


(interp b1 env sto) 
(interp b2 env sto) 





等 一 下 。 我 们 的 目的 是 ， 当 对 第 二 个 子 项 求 值 时 使 用 第 一 个 子 项 返回 的 贮存 一 一 否则 这 么 多 
改变 就 毫 无 意义 了 。 因 此 我 们 必须 先 对 第 一 个 子 项 求 值 ， 获 取 其 返回 的 喧 存 ， 用 它 对 第 二 个 


贮存 的 求 值 : 


<ms-seqC-case> : := 
[seqC (bi b2) (type-case Result (interp bi env sto) 


[v*s (v-b1 s-b1) 
(interp b2 env s-b1)])] 


先 调 用 (interp bi env sto) ， 其 返回 的 值 和 贮存 被 分 别 命 名 为 v-b1 和 s-b1 ; 接 下 来 使 用 新 
的 贮存 对 第 二 个 子 项 求 值 : (interp b2 env s-b1) 。 它 的 返回 值 该 子 项 的 值 和 贮存 ， 正 好 是 我 
们 需要 的 东西 。 代 码 也 可 以 反映 出 ， 第 一 个 子 项 的 唯一 效果 就 是 其 返回 的 贮存 : 虽然 我 们 绑 
定 了 v-bi 但 后 文 并 没有 用 到 它 


思考 题 
你 可 以 多 花 点 时 间 玩 味 一 下 这 段 代 码 。 后 面 将 经 常用 到 该 种 模式 的 代码 。 


下 面 来 处 理 双 目 算术 运算 。 它 们 和 序列 的 求 值 类 似 ， 也 含有 两 个 子 项 要 处 理 ， 但 是 这 里 我 们 
还 需要 用 到 两 个 子 项 各 自 的 值 。 和 以 前 一 样 ， 我 们 只 给 出 plusc ， multc 的 代码 基本 上 相 
同 : 


<ms-plusCc/multC-case> : := 
[plusC (1 r) (type-case Result (interp 1 env sto) 
[v*s (v-1 s-1) 
(type-case Result (interp r env s-1) 
[v*s (v-r s-r) 
(Vv*s (num+ Vv-1] v-r) s-r)])]1)] 


同样 的 模式 这 里 用 了 两 层 ， 以 便 我 们 分 别 取 得 两 个 返回 值 ， 然 后 将 其 传 给 num+ 。 


这 里 可 以 看 到 环境 和 贮存 的 重要 区 别 。 当 对 子 项 求 值 时 ， 根 据 语 言 的 作用 域 规则 ， 通 常 所 有 
子 项 都 使 用 相同 的 环境 。 环 境 的 传递 遵从 递归 向 下 的 模式 。 与 之 相对 ， 贮 存 是 线 式 传递 的 : 
所 有 的 分 支 并 不 使 用 同一 个 贮存 ， 前 一 个 分 支 产生 的 贮存 后 一 个 分 支 使 用 ， 最 后 一 个 分 支 的 


贮存 就 是 总 的 返回 贮存 。 这 种 风格 被 称 作 贮存 传递 模式 (store-passing style) 。 


现在 谜 题 彻 底 揭晓 ， 贮 存 传递 模式 就 是 我 们 的 秘密 神器 : 它 在 保障 环境 依旧 正确 处 理 词法 作 
用 域 的 同时 ， 给 了 我 们 能 够 记录 赋值 操作 的 方法 。 直 觉 告诉 我 们 ， 环 境 肯 定 参 与 这 个 过 程 ， 
同一 个 表达 式 可 以 返回 不 同 的 值 ， 现 在 我 们 可 以 看 清 这 是 怎么 做 到 的 了 : 不 是 直接 修改 环境 
实现 ， 而 是 环境 间接 的 引用 了 贮存 ， 而 贮存 会 更 新 。 下 面 我 们 需要 看 看 贮存 是 如 何 “ 更 新 "自己 
的 。 


首先 考虑 将 值 放 到 box 中 。 我 们 得 分 配 一 块 地方 让 贮存 放 东 西 。 box 的 值 会 记 住 该 地 址 ， 用 
于 之 后 box 的 赋值 操作 8 


<ms-boxC-case> ::= 
[boxC (a) (type-case Result (interp a env sto) 
[v*s (v-a s-a) 
(let ([where (new-loc)]) 
(v*s (boxV where) 
(override-store (cell where v-a) 


s-a)))]1)] 


思考 是 


注意 了 注意 了 ， 上 面 的 代码 依赖 于 new-loc ， 而 new-loc 的 实现 中 又 用 到 了 box 。 这 就 
很 槛 砍 了 。 你 能 不 能 修改 解释 器 ， 使 其 不 再 依赖 于 类 似 于 new-loc 这 种 本 身 需 要 赋值 的 
东西 ? 


要 消除 new-loc 这 种 类 型 的 东西 ， 最 简单 的 方式 是 再 给 解释 器 添加 参数 和 返回 值 ， 用 于 表示 
当前 使 用 过 的 最 大 地 址 。 每 次 分 配 贮存 地 址 的 操作 都 会 返回 北 增 过 的 地 址 ， 而 其 它 操作 则 直 
接 返 回 原 最 大 地 址 。 换 一 种 说 法 ， 我 们 又 用 了 一 次 贮存 传递 模式 。 这 样 去 实现 的 话 解释 器 会 
显得 太 策 据 ， 以 至 于 掩盖 更 重要 的 内 容 : 用 贮存 传递 模式 实现 贮存 。 这 也 就 是 为 哈 这 里 我 们 
没 这 么 做 的 原因 。 但 是 ， 我 们 必须 明白 这 么 做 是 可 行 的 : 不 依赖 于 box 而 在 我 们 的 语言 中 实 
现 box 。 


由 于 box 记录 内 存 地 址 ， 获 取 box 中 的 值 比较 简单 : 


<ms-unboxC-case> : := 


[unboxC (a) (type-case Result (interp a env sto) 
[v*s (v-a s-a) 
(v*s (fetch (boxV-] v-a) s-a) S-a)])] 


用 到 了 同样 的 模式 ， 具 体 来 说 我 们 调用 fetch 来 获取 该 地 址 中 的 实际 值 。 注 意 这 里 的 代码 没 
有 判断 a 的 求 值 结果 是 否 是 boxv ， 而 是 依赖 于 宿主 语言 Racket 在 不 是 时 抛 出 异常 ; 如 果 是 
别 的 宿主 语言 ， 不 进行 该 类 型 判断 就 可 能 很 危险 了 (比如 Ci 语言 ， 相 当 于 允许 访问 任意 内 
存 ) 。 


下 面 考虑 怎么 更 新 box 中 的 值 。 首 先 还 是 要 求 值 得 到 box 和 要 放 入 的 新 值 。 box 的 值 将 
为 boxv 类 型 ， 其 中 含有 地 址 。 


原则 上 ， 我 们 是 要 “改变 ”"， 或 者 说 履 盖 贮存 中 对 应 地 址 上 的 值 。 有 两 种 方式 可 以 实现 这 点 : 


1. 遍历 贮存 ， 找 到 对 应 地 址 的 绑 定 ， 然 后 替换 该 地 址 上 绑 定 的 值 ， 贮 存 中 的 其 它 绑 定 保 持 
“这 。 

2.， 懒 一 点 的 做 法 ， 直 接 给 贮存 新 增 绑 定 ， 而 查询 贮存 时 只 查找 最 新 的 绑 定 即 可 (就 跟 环境 
中 lookup 子 数 的 实现 一 样 ， 没 有 理由 fetch 不 这 么 干 ) 。 


两 种 选择 都 不 会 影响 到 下 面 的 代码 : 


<ms-setboxC-case> : := 


[setboxC (b v) (type-case Result (interp b env sto) 
[v*s (v-b s-b) 
(type-case Result (interp v env s-b) 
[v*s (v-v s-v) 
(Vv*s V-V 
(override-store (cell (boxV-1 v-b) 


V-V) 
s-v))])])] 


当然 ， 由 于 前 面 override-store 的 实现 就 是 cons 而 已 ， 我 们 实际 上 使 用 的 是 比较 偷懒 的 方式 
(而 且 是 有 风险 的 选择 ， 因 为 它 还 取决 于 fetch 的 实现 ) 。 


实现 另 一 种 方式 的 贮存 更 新 ， 更 新 原 有 的 绑 定 关系 ， 避 免 贮 存 中 出 现 相 同 地 址 的 多 个 绑 


> 
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在 更 新 步骤 中 ， 当 我 们 查找 贮存 中 的 地 址 时 ， 是 否 可 能 发 生 找 不 到 某 个 地 址 的 情况 ? 如 
果 可 能 ， 请 编写 程序 演示 这 种 情况 。 如 果 不 能 ， 请 指出 解释 器 的 哪个 不 变量 避免 了 这 种 
情况 的 发 生 。 


沫 了 7 现在 我 们 只 友 芭 歼 滑 用 的 情 于 了 4 友 数 调用 的 生体 汛 程 我 们 已 经 从 训 扩 了 : 生 值 注 效 
部 分 ， 求 值 参数 部 分 ， 扩 展 闭 包 的 环境 ， 然 后 再 其 中 求 值 闭 包 的 函数 体 部 ..….... 但 是 贮存 是 如 
何 参与 这 一 切 的 呢 ? 


<ms-appC-case> ::= 


[appC (f a) 
(type-case Result (interp f env sto) 
[v*s (v-f s-f) 
(type-case Result (interp a env s-f) 
[v*s (v-a s-a) 
<ms-appC-case-main>])])] ;调用 子 句 主体 


从 如 何 扩展 闭 包 的 环境 入 手 好 了 。 新 增 绑 定 的 名 字 显 然 应 该 是 函数 的 形 参 ; 但 是 它 应 该 被 绑 
定 到 什么 地 址 呢 ? 为 了 避免 使 用 已 有 地 址 将 招致 的 困 芒 (我 们 后面 将 详细 介绍 会 招致 何 种 困 
惑 | ) ， 先 使 用 新 分 配 的 地 址 吧 。 将 该 地 址 绑 定 到 环境 中 ， 然 后 将 求 得 的 参数 值 存放 在 贮存 
的 该 地 址 上 : 


<ms-appC-case-main> ::= ;调用 子 句 主体 
(let ([where (new-loc)]) 
(interp (closV-body v-f) 
(extend-env (bind (closV-arg v-f) 
where) 


(closV-env v-f)) 
(override-store (cell where v-a) s-a))) 


我 们 也 没 说 要 把 函数 参数 实现 为 可 变 的 ， 所 以 其 实 也 没 必要 这 么 实现 函数 调用 。 事 实 上 使 用 
跟 以 前 一 样 的 策略 没有 任何 问题 。 观 察 一 下 ， 在 上 面 这 种 实现 中 ， 这 个 地 址 中 的 值 也 不 会 被 
修改 : 只 有 setboxc 能 够 改变 现 有 地 址 的 内 容 (严格 来 讲 override-store 只 是 对 贮存 的 初始 
化 ) ， 而 且 只 能 改变 boxv 中 的 数据 ， 但 是 这 里 并 没有 创建 box 。 我 们 这 么 实现 是 出 于 统一 
的 考虑 ， 并 且 这 么 做 还 可 以 减少 需要 处 理 的 子 句 。 


练习 


将 贮存 地 址 限制 为 只 能 被 box 使 用 是 很 好 的 练习 。 有 哪些 代码 需要 改动 ? 


8.1 .8 回顾 尽 
尽管 完成 了 解释 器 的 实现 ， 仍 然 还 有 不 少 微妙 的 问题 和 一 些 洞察 值得 拿 出 来 讨论 一 下 。 


1. 我 们 的 解释 器 实现 中 隐藏 了 一 个 巧妙 但 重要 的 设计 抉择 : 求 值 的 顺序 。 例 如 ， 为 什么 我 
们 不 按 如 下 方式 实现 加 法 ? 


[plusC (1 r) (type-case Result (interp r env sto) 
[Vv*s (v-r s-r) 
(type-case Result (interp 1 env s-1) 
SS GV eS") 
(Vv*s (num+ Vv-1 v-r) s-1)])]1)] 


事实 上 这 样 做 也 是 自 洽 的 。 类 似 地 ， 贮 存 传递 模式 中 列 含 了 先 计算 函数 部 分 再 计算 参数 
部 分 这 种 抉择 。 注 意 到 : 


o 以 前 ， 这 种 抉择 直接 代理 给 了 宿主 语言 的 实现 ， 现 在 ， 贮 存 传 递 迫 使 我 们 把 计算 过 
程 顺序 化 ， 因 此 该 抉择 是 由 我 们 自己 作出 的 〈 不 管 是 有 意 还 是 无 意 ) 。 

@ 更 为 重要 的 是 ， 现 在 这 是 语义 上 的 抉择 了 。 在 没有 赋值 之 前 ， 加 法 一 个 分 支 上 的 计 
算 不 会 影响 另 一 个 分 支 上 的 计算 结果 。【 注 释 】 而 现在 ， 分 支 上 可 能 会 执行 赋值 操 
作 从 而 因此 影响 到 另 一 分 支 ， 因 此 要 使 该 语言 的 程序 员 能 预测 自己 程序 的 行为 ， 我 
们 必须 选择 某 种 求 值 顺序 ! 明确 地 写 出 贮存 传递 解释 器 也 表明 了 这 一 点 。 

2.， 观察 函数 调用 的 规则 ， 可 以 发 现 ， 我 们 往 下 传递 的 是 动态 的 贮存 ， 即 ， 先 后 经 过 了 计算 
函数 和 计算 参数 的 那个 贮存 。 这 种 行为 跟 我 们 对 于 环境 的 要 求 正好 相反 。 这 是 个 关键 的 
区 别 。 贮 存 从 其 效果 上 来 说 ， 是 “动态 作用 域 的 (dynamically scoped)”， 这 是 由 于 它 是 
用 于 反映 计算 的 历史 ， 而 不 是 用 来 反映 词法 上 的 东西 。 由 于 我 们 已 经 使 用 了 名 词 “ 作 用 域 

(scope ) "来 表示 标识 符 的 绑 定 ， 这 时 再 用 "动态 作用 域 的 "来 描述 贮存 可 能 会 造成 困惑 。 

于 是 我 们 引入 新 名 词 持 久 的 (persistent) 来 描述 贮存 。 


一 些 语 言 中 这 两 个 概念 混 消 不 清 。 例 如 在 C 语 言 中 ， 绑 定 到 局 域 标识 符 上 的 值 (默认 ) 在 
堆栈 上 分 配 。 然 而 ， 堆 栈 对 应 于 这 里 的 环境 ， 因 此 它们 将 随 着 函数 调用 的 结束 而 消失 。 
如 果 函 数 返 回 值 中 引用 了 这 些 值 ， 那 么 这 个 引用 将 会 指向 某 个 未 使 用 的 地 址 ， 或 者 被 用 
作 他 用 的 地 址 : C 语 言 中 很 大 一 部 分 错误 来 源 于 此 。 问 题 的 关键 是 ， 值 本 身 不 会 消失 ; 消 
失 指 向 它们 的 、 具 有 词法 作用 域 的 标识 符 。 


3. 我 们 已 经 讨论 过 两 种 实现 履 写 贮存 的 策略 : 简单 的 扩展 之 (将 依赖 于 fetch 的 实现 ， 
要 它 总 是 取出 最 新 的 绑 定 ) ; 或 者 采用 "搜索 替换 ”的 方式 。 后面 这 种 策略 有 个 好 处 ， 要 
存储 那些 无 用 的 、 永 远 不 可 能 访问 得 到 的 数据 。 


然而 这 么 做 还 是 会 浪费 内 存 。 随 着 程序 的 运行 ， 我 们 会 永久 失去 访问 某 些 box 的 能 力 : 
例如 ， 某 个 box 仅 被 绑 定 到 一 个 标识 符 上 ， 程 序 走 出 该 标识 符 的 作用 域 后 【将 再 也 不 能 
访问 到 该 pox ) 。 这 些 不 能 被 访问 到 的 位 置 被 称 为 垃圾 (garbage) 。 从 概念 上 来 讲 ， 垃 
网 之 后 对 程序 求 值 结果 没有 任何 影响 的 地 址 。 有 很 多 用 于 辨别 并 回收 垃 
圾 的 策略 ， 通 常 被 称 作 垃圾 回收 (garbage collection) 。 


4， 要 注意 ， 计 算 表 达 式 的 时 候 ， 总 是 要 让 后 面 的 计算 依赖 之 前 返回 的 贮存 以 维护 正确 的 执 
行 历史 。 上 比如， 考虑 下 面 这 种 unboxc 的 实现 : 


[unboxC (a) (type-case Result (interp a env sto) 
[v*s (v-a s-a) 
(v*s (fetch (boxV-l1 v-a) sto) S-a)])] 


注意 到 区 别 没 有 2? 我们 没有 从 s-a 而 是 从 sto 中 获取 值 。 但 sto 反映 的 
是 unboxc 未 求 值 之 前 的 赋值 历史 ， 而 没有 包含 它 求 值 过 程 中 的 赋值 历 
史 。 unboxc 表达 式 求 值 过 程 中 贮存 可 能 发 生 改 变 吗 ? 当然 了 | 


(let(Lb (box oo) 
(unbox (begin (set-box! b 1) b))) 


如 果 按 照 上 面 这 种 错误 的 实现 ， 它 将 得 到 0 而 不 是 正确 的 值 1。 


5 下面 是 另 一 个 类 似 的 错误 : 


[unboxC (a) (type-case Result (interp a env sto) 
[v*s (v-a s-a) 
(v*s (fetch (boxV-l1 v-a) s-a) sto)])] 


什么 例子 程序 可 以 展示 其 错误 呢 ? 注意 到 ， 它 返回 的 是 原始 的 贮存 ， 未 经 Unboxc 求 
值 过 程 修改 。 所 以 我 们 需要 在 后 续 代码 中 访问 贮存 : 
(let ([b (box 9)]) 
(+ (unbox (begin (set-box! b 1) 


b ) 
(unbox b) ) ) 


它 本 应 求 值得 2， 但 是 由 于 返回 的 贮存 中 b 的 值 一 直 绑 定 为 0， 导 致 结 果 为 1。 


如 果 把 前 述 二 点 中 的 错误 结合 起 来 一 一 解释 器 子 句 中 最 后 一 行 两 次 都 使 用 sto 而 不 
该 表达 式 的 结果 将 变 成 0. 





日 
不 S-a 


将 解释 器 中 所 有 贮存 ， 逐 一 替换 为 更 新 前 的 贮存 ; 对 每 一 个 这 样 的 修改 ， 给 出 能 够 
显示 其 错误 的 测试 案例 ; 请 确保 你 最 后 得 到 履 盖 所 有 情况 的 测试 案例 集 。 


.观察 前 述 对 “ 旧 ” 贮 存 的 使 用 ， 它 允许 我 们 进行 时 间 回 溯 : 赋值 引入 了 时 间 的 概念 ; 使 用 原 
先 的 贮存 则 允许 我 们 回 到 过 去 ， 也 就 是 赋值 没有 发 生 之 前 。 这 听 起 来 一 方面 变 有 趣 另 一 
方面 有 悖 常情 ; 它 有 合理 用 途 吗 ? 


有 ! 想象 一 下 ， 我 们 不 直接 改变 贮存 ， 而 是 引入 日 志 的 概念 ， 表 示 贮 存 中 意向 中 的 更 

新 。 日 志 的 实现 方式 类 似 于 贮存 ， 线 性 传递 。 (语言 中 ) 添加 创建 新 日 志 的 指令 ; 对 于 
查询 操作 ， 首 先 检 查 日 志 ， 仅 当日 志 中 找 不 到 某 个 地 址 的 绑 定 时 ， 才 在 实际 贮存 中 查 

找 。 还 要 添加 两 个 新 指令 : 丢弃 (discard) 某 个 日 志 〈 用 于 进行 时 间 回 溯 ) ， 以 及 提交 
(commit) 操作 (将 茶 个 日 志 中 的 修改 全 部 应 用 到 贮存 中 ) 。 


事实 上 这 就 是 软件 事务 内 存 (Software Transactional Memory) 的 概念 。 (每 条 线程 都 
只 能 看 到 自己 的 日 志和 全 局 的 贮存 ， 看 不 到 其 他 线程 的 日 志 ，) 其 他 线程 在 提交 日 志 之 
前 所 做 的 修改 对 本 线程 是 透明 的 。 这 就 是 说 ， 每 个 线程 看 到 的 世界 都 是 一 致 的 (能 看 到 
自己 所 做 的 修改 ， 因 为 它们 都 在 日 志 中 ) 。 如 果 事 务 成 功 完成 (提交 ) ， 那 么 所 有 线程 
都 都 会 看 到 更 新 后 的 全 局 贮存 ; 如 果 事 务 中 止 (丢弃 ) ， 被 丢弃 的 日 志 也 带 走 了 其 中 所 
有 的 修改 ， 状 态 还 原 (其 他 线程 做 提交 还 是 会 生效 ) 。 


多 线程 编程 会 带 来 很 多 难题 ， 软 件 事务 内 存 提供 了 一 种 非常 合理 的 解决 办 法 ， 如 果 线 程 
间 必 须 共 享 可 变 状态 的 话 。 大 部 分 计算 机 都 只 有 一 个 全 局 存储 ， 维 护 日 志 成 本 可 能 会 很 
高 ， 所 有 人 们 花 了 很 大 精力 优化 它们 。 另 一 种 解决 方案 是 ， 某 些 硬件 架构 开始 提供 对 事 
务 内 存 的 直接 支持 ， 这 使 得 日 志 的 创建 、 维 护 和 提交 可 以 和 操作 全 局 存储 一 样 高 效 ， 移 
除了 采用 该 想法 的 一 个 重大 阻碍 。 
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修改 语言 ， 增 加 日 志 功 能 以 实现 软件 事务 内 存 。 
练习 
另 一 种 实现 策略 是 ， 在 环境 中 将 名 字 映 射 到 box 类 型 的 值 。 这 里 我 们 没有 这 样 做 是 因为 : 


这 样 做 的 话 有 种 作 汶 的 感觉 

学 不 到 不 使 用 box 实现 该 特性 的 方法 
不 一 定 能 扩展 到 其 他 赋值 操作 

更 重要 的 是 ， 不 能 让 我 们 获得 这 些 洞 见 


CO 


不 过 理解 该 策略 还 是 很 有 用 的 ， 而 且 你 在 实现 自己 的 语言 的 时 候 可 能 会 觉得 采用 这 也 是 
个 好 主意 。 , ， 试 试 使 用 这 种 策略 实现 一 下 我 们 的 解释 器 。 你 还 需要 贮存 传递 模式 
吗 ? 为 什么 


影响 是 ， 某 个 分 支 可 能 会 报错 或 者 永 人 当然 这 都 是 外 部 可 见 的 影响 ， 但 
ee 次 的 影响 。 如 果 程 序 正常 返回 的 话 ， 不 管 选 择 哪 种 来 值 顺序 ， 返 回 值 
We o 
丰 号 
8.2 殉 旦 
搞定 了 可 变 结构 体 ， 接 下 来 考虑 另 一 种 情况 : 变量 赋值 。 
8.2.1 术语 


首先 ， 关 于 名 词 的 选择 。 之 前 我 们 一 直 坚 持 使 用 "标识 符 ”， 这 是 因为 我 们 想 将 “变量 " 留 给 将 要 
学 习 的 东西 。 a 当 我 们 写 出 (这 里 假设 x 为 局 域 绑 定 的 ， 比 如 是 某 个 方法 的 参数 ) 


x 


1; 
3) 


x 


我 们 是 在 要 求 改变 x 的 值 。 经 过 第 一 次 赋值 之 后 ，x 的 值 为 1 ; 第 二 次 之 后 为 3。 
此 ，x 的 值 会 在 方法 的 执行 过 程 中 变化 


我 们 在 数学 中 通常 也 会 使 用 "变量 "这 个 词 表示 函 数 参 数 。 例 如 ， 在 f(y) = y + 3 中 ， 我 们 

称 y 为 “变量 *。 这 里 它 被 称 为 变量 是 由 于 不 同 的 调用 之 间 y 的 值 也 不 同 ; 然而 ， 在 同一 次 调 
用 内 部 ， 在 其 作用 域内 它 的 值 总 是 一 样 的 。 之 前 的 标识 符 对 应 于 这 种 意义 上 的 变量 。【 注 
释 】 与 之 相对 的 ， 程 序 变 量 在 每 次 调用 内 部 都 可 以 变化 ， 如 上 面 Java 代 码 中 的 x 。 


如 果 某 个 标识 符 被 绑 定 到 一 个 box ， 那 么 它 将 总 是 被 绑 定 到 同一 个 box 值 。 会 发 生 改 变 
的 是 box 的 内 容 ， 标 识 符 和 box 的 绑 定 关 系 不 会 变 。 


从 今 往 后 ， 我 们 使 用 变量 表示 在 其 作用 域内 值 可 以 发 生变 化 的 标识 符 ， 而 值 不 能 变化 的 使 用 
标识 符 表示 。 如 果 情 况 存疑 时 ， 安 全 一 点 ， 我 们 就 称 之 为 “变量 ”; 如 果 这 种 区 分 不 太 重要 时 ， 
我 们 也 可 能 使 用 其 中 任意 一 个 。 不 要 被 这 些 名 词 搞 得 头 大 ， 重 要 的 是 理解 它们 的 区 别 。 


8.2.2 语法 


大 部 分 语言 使 用 = 或 者 := 表示 赋值 ，Racket 选 择 了 不 同 的 语法 : 使 用 set! 进行 变量 赋 
值 。 这 就 要 求 Racket 程 序 员 en di 的 区 别 。 当 然 ， 这 里 我 们 绕 开 语法 区 
别 ， 在 我 们 的 核心 语言 中 使 用 不 同 的 结构 分 别 表示 box 和 变量 。 


变量 赋值 ， 首 先 要 认识 到 的 是 ， 尽 管 它 和 box 赋 值 (setboxC) 一 样 有 两 个 子 项 ， 但 是 两 
者 的 语法 是 完全 不 同 的 。 为 了 理解 其 中 区 别 ， 先 考虑 下 面 的 Java 代 码 : 


在 这 个 语句 中 ，x 的 位 置 和 式 : 它 必 须 是 标识 符 本 身 。 这 是 因为 ， 如 果 该 位 置 
为 任意 表达 式 ， 那 么 ee 行 求 值 ， Se 得 到 某 个 值 : 例如 ， 如 果 x 之 前 绑 定 到 
1， 那 就 意味 着 我 们 将 会 产生 下 面 这 样 的 式 子 : 


但 显然 这 是 没 意 义 的 ! 我 们 不 能 给 1 ， 事实 上 1 就 是 所 谓 的 不 变量 。 我 们 想 要 的 是 找 
到 x 在 贮存 中 的 位 置 ， 然 后 改变 该 位 存 的 值 


再 看 个 例子 。 假 设 局 域 变 量 o 被 绑 定 到 某 个 字符 囊 对 象 。， 然 后 我 们 写 出 下 面 的 语句 : 


0 = new String("a new string") 


我 们 是 打算 修改 s 吗 ? 当然 不 是 。 该 指令 应 该 保持 s 不 变 ， 我 们 只 是 想 改 变 o 指向 的 值 ， 
使 得 后 面 程序 中 o 被 求 值 时 得 到 的 是 这 个 新 的 字符 串 对 象 。 


8.2.3 解释 器 之 解释 变量 
首先 修改 语法 : 


(define-type ExprC 
[numC (n : number)] 
[varc (s : symbol)] 
[appC (fun : EXxprC) (arg : ExprcC)] 
[plusCc (1 : ExprC) (r : ExprcC)] 
[multC (1 : ExprC) (r : ExprcC)] 
[lamC (arg : Symbol) (body : ExprcC)] 
[setC (var : Symbol) (arg : Exprc)] 
[seqC (bi : ExprC) (b2 : ExprCc)]) 


可 以 看 见 我 们 丢弃 了 box 相关 操作 ， 但 是 保留 了 序列 ， 因 为 赋值 和 序列 操作 息息相关 。 注 意 
我 们 添加 的 setc 形式 ， 其 第 一 个 子 项 不 是 表达 式 而 是 变量 的 名 字 。 同 时 我 们 还 将 idc 改 
作 VarC ° 


由 于 去 掉 了 box ， box 值 也 不 需要 了 : 


(define-type Value 
[numv (n : number)] 
[closv (arg : Symbol) (body : ExprC) (env : Env)]) 


可 能 和 你 想 的 一 样 ， 为 了 支持 变量 ， 出 于 和 前 面相 同 的 原因 ， 我 们 仍 需要 用 到 贮存 传递 模式 
(8.1.7 节 ) 。 区 别 在 于 如 何 使 用 它 。 注 意 到 之 前 序列 的 实现 不 需要 变动 ( 它 并 不 依赖 于 要 改 
变 的 东西 是 box 还 是 变量 ) ， 于 是 就 只 剩 下 变量 赋值 需要 处 理 了 。 


首先 还 是 要 对 新 值 表达 式 求 值 ， 并 获取 更 新 后 的 贮存 : 


<setC-case> ::= 
[setC (var val) (type-case Result (interp val env sto) 


[v*s (v-val s-val) 
<rest-of-setC-case>])] ;setC 子 名 其 余部 分 


接 下 来 呢 ? 前 面 讨论 过 了 ， 对 于 变量 部 分 ， 我 们 不 应 对 求 其 值 (这 么 做 只 会 获取 其 日 值 ) ， 
而 是 应 该 获取 它 对 应 的 存储 地 址 ， 然 后 更 新 该 地 址 中 的 内 容 ， 最 后 这 步 和 之 前 box 的 处 理 类 
似 : 


<rest-of-setC-case> ::= ;SetC 子 句 其 余部 分 
(let ([where (lookup var env)]) 
(v*s v-val 


(override-store (cell where v-val) 
s-val))) 


这 个 新 模式 才 是 意义 所 在 。 在 处 理 box 的 过 程 中 ， 对 于 idc 的 处 理 是 : 先 从 环境 中 找 出 标识 符 
的 地 址 ， 然 后 直接 从 贮存 中 获取 其 值 ; 两 步 之 后 得 到 值 ， 和 (在 解释 器 中 ) 增加 贮存 之 前 进 
行 查找 获得 的 是 一 种 东西 。 而 现在 ， 新 的 模式 是 : 对 于 变量 标识 符 的 处 理 止 步 于 从 环境 中 获 
取 其 存储 地 址 (并 不 继续 获取 其 值 ) 。 这 样 获 得 的 值 按 按照 传统 被 称 为 左 值 ，“ (赋值 语句 ) 
左 侧 的 值 " 之 意 。 这 是 “存储 地 址 ”花哨 的 说 法 ， 它 和 贮存 中 存储 的 真实 值 不 同 : 注意 到 它 并 不 
和 value 中 任何 类 型 对 应 。 


这 个 解释 器 已 经 完成 了 ! 所 有 的 难点 已 经 在 之 前 实现 贮存 传递 模 时 (包括 处 理 函 数 调用 时 ， 
给 新 变量 分 配 地 址 ) 搞定 了 。 


8.3 设计 语言 时 状态 的 考虑 


尽管 大 部 分 语言 都 包含 状态 ， 我 们 所 学 习 的 两 种 状态 之 一 或 者 两 者 都 有 ; 但 是 它们 的 选 入 不 
应 该 被 当做 一 件 微不足道 或 者 理所当然 的 事 。 一 方面 ， 状 态 的 引入 带 来 了 明显 的 好 处 : 


e@ 状态 提供 了 某 种 形式 的 模块 化 。 拿 我 们 上 面 实 现 的 解释 器 为 例 ， 如 果 没 有 显 式 的 状态 操 
作 (而 要 达到 同样 效果 ) 
o 为 了 传递 贮存 ， 需 要 将 其 放 入 所 有 遂 数 的 参数 和 返回 值 中 
o 所 有 可 能 会 涉及 到 状态 的 函数 都 需要 修改 ， 维 护 信 息 的 传递 链 可 以 将 编程 语言 中 的 
状态 理解 为 在 所 有 函数 间 隐 式 流动 的 的 参数 和 返回 值 ， 而 无 需 程序 员 费 力 地 维护 。 
它 使 得 不 同 函 数 可 以 进行 “ 超 距 "通信 ， 中 间 子 程序 无 需 知 晓 这 种 通信 。 
e。 状态 得 以 让 我 们 构造 动态 、 环 形 的 数据 结构 ， 或 者 至 少 提供 了 一 种 简洁 直观 的 方式 做 到 
(第 九 章 会 讨论 ) 

。 状态 赋予 子 程序 内 存 ， 比 如 前 述 的 new-loc。 如 果 某 个 子 程序 没 法 自己 记 住 事 情 ， 那 么 其 
调用 者 就 必须 帮 它 完成 ， 本 质 上 就 是 做 类 似 于 传递 贮存 的 事情 。 这 么 做 不 仅 不 方便 ， 还 
给 调用 者 恶意 修改 内 存 的 机 会 〈 比 如 说 ， 子 程序 的 调用 者 可 以 故意 送 回 上 昌 的 贮存 ， 从 而 
获取 已 经 交 给 其 他 调用 方 的 引用 ， 通 过 这 种 方式 发 起 正确 性 或 安全 攻击 ) 。 


另 一 方面 ， 状 态 也 给 程序 员 和 处 理 程序 的 程序 (如 编译 器 ) 带 来 不 少 麻烦 。 其 中 一 个 是 “别名 
(aliasing)”， 以 后 我 们 会 讨论 到 。 另 一 个 是 “引用 透明 (referential transparency) ”， 也 是 希 
望 以 后 我 们 能 讨论 到 。 最 后 ， 上 面 我 们 说 过 状态 提供 了 某 种 形式 的 模块 化 。 然 而 ， 换 个 角度 
看 ， 两 个 子 程序 之 间 通 过 秘密 炬 道 进行 了 通信 ， 而 它们 的 中 间 人 无 法 获知 也 无 法 监控 这 种 通 
言 。 茶 些 情况 下 (特别 是 安全 系统 和 分 布 式 系统 中 ) ， 这 种 秘密 渠道 非常 危险 ， 也 不 受 欢 

迎 。 


一 >、 


没有 完美 的 方案 ， 所 以 一 种 明智 的 选择 是 ， 提 供 赋值 操作 ， 同 时 又 对 其 区 别 对 待 。 例 如 ， 
Standard ML 中 没有 变量 ， 因 为 它 被 认为 不 是 必要 的 。 但 是 该 语言 包含 了 等 价 于 box 的 东西 
(叫做 ref( 引 用 )) 。 你 可 以 很 容易 的 用 box 模拟 变量 (例如 ， 研 究 new-loc 函 数 ， 看 看 怎么 用 
变量 而 不 是 box 实 现 它 ) ， 所 以 语言 的 表达 能 力 并 没 减 少 ， 尽 管 由 于 box 使 用 不 惯 可 能 (和 变 
量 相 比 ) 导致 更 严重 的 别名 问题 。 


作为 回报 ， 开 发 者 得 到 一 种 有 意义 的 类 型 : 除非 某 个 数据 结构 中 包含 ref， 否 则 它 就 可 以 被 认 
为 是 不 可 变 的 ; ref 的 存在 也 提醒 开发 人 员 和 程序 (如 编译 器 ) ， 底 下 的 值 可 能 会 发 生 改 变 。 
比如 说 ， 如 果 b 是 box， 程 序 员 就 应 该 知道 ， 将 (unbox b) 绑 定 到 Vv， 然 后 用 v 替 换 程 序 中 所 有 
的 (unbox b) 是 不 明智 的 做 法 : 原来 程序 总 是 去 获取 box 的 当前 值 ， 改 了 之 后 就 变 成 访问 原先 
的 值 了 。《〈 反 过 来 ， 如 果 程 序 员 需要 某 个 时 间 的 值 ， 无 论 以 后 box 怎 么 被 赋值 ， 那 么 就 可 以 获 
取 当 前 值 ， 将 其 绑 定 ， 而 不 是 老 是 去 unbox。) 


8.4 参数 传递 


我 们 当前 实现 的 解释 器 中 ， 对 于 每 个 函数 调用 ， 总 是 分 配 新 地 址 用 于 存储 参数 。 这 意味 着 : 


(let ([f (lambda (x) (set! x 3))]) 
(let ([y 5]) 

(begin 

(f y) 

y))) 


会 计算 得 到 5 而 不 是 3。 这 是 因为 ， 形 参 x 的 值 和 实 参 y 的 值 存放 在 不 同 的 地 址 ， 所 以 对 Xx 赋值 不 


研 
会 影响 y。 


现在 ， 试 想 程 序 以 下 面 说 的 这 种 方式 执行 。 当 实 参 为 变量 时 一 一 它 在 内 存 中 在 有 个 地 址 一 一 
我 们 不 再 为 该 值 重 新 分 配 地 址 ， 而 是 直接 使 用 变量 原来 的 地 址 。 于 是 现在 形 参 和 实 参 指向 的 
是 内 存 中 的 同一 块 地 址 : 即 它 们 为 变量 别名 (variable aliases) 。 这 样 对 形 参 的 赋值 会 影响 调 
用 者 ; 上 面 的 例子 将 计算 得 到 3 而 不 是 5。 这 被 称 为 传 引用 调用 (call-by-reference) 参数 传递 
策略 。 


相反 ， 我 们 的 解释 器 实现 了 传 值 调用 (call-by-value) ，Java 等 语言 也 采取 这 种 参数 传递 
策略 。 一 个 有 点 费解 之 处 是 ， 如 果 传 递 的 值 本 身 是 可 变 的 (译注 : 类 似 于 我 们 的 box) ， 
在 被 调用 函数 中 进行 的 修改 能 被 调用 者 看 到 。 这 仅仅 是 可 变数 据 的 产物 ， 而 不 是 传递 策 


略 导致 的 。 请 区 分 清楚 ! 


在 一 段 时 间 里 ， 传 引用 调用 被 认为 是 好 主意 。 使 用 它 可 以 写 出 一 些 有 用 的 抽象 ， 比 如 swWap 函 
数 ， 调 用 该 函数 将 交换 调用 者 手 上 两 个 变量 的 值 。 不 过 ， 这 种 特性 的 劣势 远大 于 其 优势 : 


。 粗心 的 程序 员 可 能 会 无 意 间 创建 了 别名 变量 ， 然 后 修改 其 值 〈 而 没有 意识 到 自己 这 么 做 
了 ) ， 调 用 者 可 能 永远 不 会 注意 到 这 种 错误 ， 直 到 某 个 特别 条 件 触发 了 该 修改 。 

e 有 些 人 认为 这 种 策略 效率 更 高 所 以 是 必然 的 选择 : 他 们 如 果 不 是 传 引用 的 话 ， 其 他 策略 
需要 拷贝 大 量 数据 。 但 是 ， 传 值 调用 也 可 以 仅 传递 数据 结构 的 地 址 。 仅 在 这 种 情况 (a 并 
且 b 并 且 c) 下 需要 拷贝 数据 : (a) 数 据 结构 是 可 变 的 ，(b) 不 希望 被 调用 者 〈 译 注 ， 原 文 此 
处 为 调用 者 ， 逻 辑 关系 并 不 合理 故 如 此 翻译 ) 改变 参数 的 值 ，(c) 语 言 本 身 没 有 提供 符号 
支持 或 者 其 他 机 制 将 此 参数 标记 为 不 可 变 。 

。 它 必然 会 导致 不 统一 的 、 非 模块 化 的 推理 。 例 如 ， 考 虑 如 下 的 子 程序 : 

(define (f 9g) 
(let ([x 10]) 
(begin 


(g x) 
A 


如 果 允 许 传 引用 参数 传递 的 话 ， 程 序 员 将 不 能 仅 看 局 部 代码 一 一 也 就 只 看 这 一 段 
确定 省 略 号 中 x 的 值 。 





如 果 某 个 语言 非 要 允许 传 引用 调用 的 话 ， 至 少 需 要 让 调用 者 决定 是 传 引用 让 在 被 调用 者 
内 部 共享 传 入 的 内 存 地 址 一 一 还 是 不 使 用 传 引用 。 然 而 即使 使 用 这 种 方式 也 不 怎么 样 ， 因 为 
现在 被 调用 者 面临 对 称 的 问题 它 的 参数 是 不 是 个 别名 呢 。 传 统 的 顺序 式 程序 中 ， 这 还 不 
是 个 问题 ， 但 是 如 果子 程序 是 可 重 入 的 ， 被 调用 者 就 面临 这 种 窘境 。 








所 以 是 时 候 考 虑 一 下 引入 任何 这 种 东西 是 否 值得 了 。 如 果 调 用 者 想 要 某 个 子 程序 执行 茶 种 赋 
值 操作 ， 传 box 值 就 好 了 。 box 表明 ， 调 用 者 接受 一 一 甚至 说 请 求 一 一 被 调用 者 进行 赋值 操 
作 ， 执 行 结束 后 调用 者 只 需 从 box 中 抽取 出 值 。 当 然 这 样 我 们 就 不 能 写 出 很 简洁 的 swap 子 程 
序 ， 但 是 为 了 申 实 世界 软件 工程 的 考虑 ， 这 点 小 代价 还 是 花 的 起 的 。 





9 递归 和 循环 : 子 程序 与 数据 


递归 指 的 是 自我 引用 的 行为 。 编 程 语言 中 存在 (至少) 两 种 形式 的 递归 : 数据 的 递归 和 控制 
的 递归 (程序 行为 ， 也 就 是 函数 的 递归 ) 。 


9.1 递归 与 循环 数据 


数据 中 的 递归 还 可 以 分 两 种 情况 : 引用 与 自身 相同 类 型 的 事物 ， 或 者 就 是 直接 引用 自身 。 


第 一 种 情况 即 我 们 传统 称 为 递归 数据 。 例 如 ， 树 是 一 种 递归 数据 结构 : 任 一 节点 可 以 有 若干 
子 节点 ; 每 个 子 节点 自身 也 是 树 。 不 过 ， 如 果 编 写 程序 遍历 树 ， 无 需 记录 哪些 节点 已 经 被 访 
问 。 树 是 有 穷 的 数据 结构 。 


与 之 对 应 的 是 图 这 种 循环 (cyclic) 数据 : 节点 引用 其 他 节点 ， 可 能 最 终 通 过 引用 链 引 用 回 自 
身 。 (当然 ， 节 点 还 可 以 直接 引用 自身 。) 遍历 图 的 时 候 ， 如 果 不 记录 已 访问 过 的 节点 ， 计 
算 过 程 就 可 能 发 散 ， 即 不 会 终止 。 图 的 算法 需要 记 住 已 访问 过 的 节点 ， 从 而 避免 重复 遍历 。 


给 我 们 的 语言 添加 递归 的 数据 结构 ， 如 链表 或 树 ， 比 较 简 单 直接 。 主 要 需要 实现 两 点 : 


1. 创建 复合 结构 (compound structure) 的 能 力 (例如 节点 可 以 引用 子 树 ) 
2， 结 束 递归 的 能 力 (如 树 结构 的 叶 节 点 ) 


练习 
给 语言 添加 内 建 数据 类 型 : 链表 、 二 又 树 


添加 循环 数据 更 为 微妙 。 考 虑 循环 数据 的 最 简单 形式 ， 指 向 自身 的 单元 格 : 





试 试 在 Racket 中 定义 它 。 尝 试 : 


(let ([b b]) 
b) 


但 这 行 不 通 : let 中 右边 那个 b 未 绑 定 。 把 语法 糖 解 开 可 以 看 的 更 清楚 : 


((lambda (b) 
b) 


b) 


了 清楚 起 见 ， 我 们 可 以 重 命名 函数 中 的 b : 


((lambda (x) 
x) 
b) 


明显 p 未 绑 定 。 


不 使 用 额外 的 Racket 构 造 的 情况 下 【注释 】， 显 然 我 们 无 法 直接 创建 循环 数据 。 我 们 需要 给 
数据 创建 "地 址 ”， 然 后 在 该 地 址 中 引用 自己 。 注 意 这 里 是 用 了 "然后 "， 它 暗示 时 间 的 概念 ， 昌 
我 们 需要 使 用 赋值 操作 。 这 样 的 话 ， 我 们 可 以 试 试 用 pox 来 实现 。 


指 shared 构造 ， 不 过 其 他 语言 基本 上 都 没有 这 个 机 制 ， 所 以 这 里 我 们 也 不 深究 它 了 。 我 
们 这 里 学 习 的 东西 正 是 shared 幕后 实现 的 基本 原理 。 


计划 如 下 : 首先 ， 创 建 box 并 将 其 绑 定 到 某 个 标识 符 ， 设 为 p ; 改变 box 中 的 值 ， 我 们 项 
望 其 中 存 什么 呢 ? 当然 是 对 自身 的 引用 。 怎 么 获得 该 引用 呢 ? 通过 名 字 p 。 通 过 这 种 方式 ， 
我 们 创建 了 环 状 数据 : 


(let ([b (box :dummy)]) 
(begin 
(set-box! b b) 
b)) 


注意 ， 上 面 的 程序 在 Typed PLAI 中 无 法 运行 ， 后 面 会 谈 到 如 何 给 该 程序 添加 类 型 。 现 在 ， 要 
运行 上 面 的 程序 ， 请 使 用 动态 类 型 的 ( #1lang plai ) 语言 。 

运行 上 面 的 程序 ，Racket 显 示 #0='#8#0# 。 这 个 表达 式 正 是 我 们 想 要 的 。 回 想 一 下 ， 前 面 提 
到 过 # 是 Racket 中 box 的 显示 方式 。 #6= (其 中 0 换 成 其 他 数 也 是 一 样 ) 是 Racket 中 对 于 循 
环 数 据 的 命名 方式 。 因 此 ， 上 面 结果 字面 意思 就 是 " # 被 绑 定 到 了 一 个 box， 其 内 容 

为 #6# ， 即 绑 定 到 #0 的 东西 ， 即 它 自己 ”。 


练习 
在 你 自己 的 解释 器 中 运行 与 这 段 代码 ， 确 保 其 产生 循环 的 数据 值 。 怎 么 检测 这 一 点 呢 ? 


上 述 思 想 可 以 用 于 其 它 数据 类 型 。 通 过 这 种 方式 ， 我 们 能 够 创建 循环 的 链表 、 图 等 等 。 核 心 
思想 就 是 分 两 步 做 : 先 命名 一 个 空 的 占 位 符 ; 然后 修改 占 位 符 中 的 内 容 为 其 自身 ; 要 获取 " 自 
身 "”， 使 用 第 一 步 中 绑 定 的 名 字 即 可 。 当 然 ， 不 限于 “ 自 循环 ": 我 们 也 可 以 创建 相互 循环 的 数 
据 〈 没 有 某 个 元 素 是 循环 的 ， 但 它们 的 组 合 是 循环 的 ) 。 


9.2 递归 函数 


0 oo Rs 


0) ， ia es 总 Ss 如 
首先 ， 用 递归 实现 阶乘 函数 : 


(let ([fact (lambda (n) 
(ifo n 
工 
(Cn 人 fact (- n 1)))))]) 
(fact 10)) 


这 根本 行 不 通 ! 它 将 报错 内 层 的 fact 未 绑 定 ， 和 前 面 循环 数据 的 例子 相同 。 


出 现 这 种 错误 我 们 并 不 感到 奇怪 。 毕 竞 到 目前 为 止 ， 我 们 实现 的 绑 定 机 制 并 不 会 自动 使 函数 
定义 支持 循环 (事实 上 ， 在 一 些 早 期 的 编程 语言 中 ， 函 数 也 不 自动 支持 循环 : 递归 被 当 作 特 
丈 的 特性 ) 。 想 要 递归 的 话 即 某 个 函数 定义 可 以 循环 的 引用 自己 一 一 我 们 必须 手工 实现 
这 点 。 





号 - 王 


如 果 按 惯例 在 顶层 定义 函数 ， 你 就 不 会 遇 到 问题 。 顶 层 的 绑 定 意味 着 它 要 么 是 变量 ， 要 
么 是 pox。 所 以 下 面 说 的 模式 基本 上 自动 就 帮 你 完成 了 。 这 也 是 为 什么 当 你 需要 局 部 循环 
引用 的 时 候 ， 必 须 使 用 letrec 或 者 local ， 而 不 是 let 的 原因 。 


么 解决 手段 也 很 明了 : 问题 和 上 一 个 类 似 ， 方 案 就 也 用 一 样 的 。 还 是 三 步 走 : 先 创建 占 位 
符 ， 然 后 在 需要 循环 引用 的 地 方 使 用 该 占 位 符 ， 最 后 在 使 用 之 前 要 对 占 位 符 赋值 : 


(let ([fact (box 'dummy)]) 
(let ([fact-fun 
(lambda (n) 
(if (zero? n) 
J. 


(* n ((unbox fact) (- n 1)))))]) 
(begin 
(set-box! fact fact-fun) 
((unbox fact) 10)))) 


事实 上 ， 我 们 并 不 需要 fact-fun : 这 样 写 只 是 为 了 清晰 起 见 。 注 意 到 fact-fun 不 是 递归 
的 ， 而 且 可 以 认为 它 是 标识 符 而 不 是 变量 ， 所 以 我 们 可 以 直接 使 用 它 的 值 : 


(let ([fact (box "dummy)]) 
(begin 
(set-box! fact 
(lambda (n) 
(if (zero? n) 
工 


(* n ((unbox fact) (- n 1)))))) 
((unbox fact) 10))) 


号 


这 里 有 点 小 瑕 疯 ， 我 们 使 用 fact 的 时 候 总 得 unbox 。 如 果 语 言 中 有 变量 ， 这 么 实现 看 起 来 更 
完美 : 


(let ([fact 'dummy]) 
(begin 
(set! fact 
(lambda (n) 
(if (zero? n) 
3 


(* n (fact (- n 1)))))) 
(fact 10))) 


事实 上 上， 变量 的 一 个 用 途 就 是 简化 上 述 模 式 的 去 语法 糖 过 程 ， 不 再 需要 每 次 使 用 循环 绑 
定 的 标识 符 时 都 得 Unbox 。 另 一 方面 ， 通 过 一 些 额外 的 努力 ， 去 语法 糖 过 程 也 可 以 把 
Unbox 带 掉 。 


9.3 草率 的 观察 


到 这 里 我 们 发 现 一 个 遵从 同样 时 间 顺 序 的 模式 : 创建 、 更 新 、 使 用 。 我 们 可 以 将 这 个 过 程 
在 语法 糖 中。 考虑 实现 下 面 的 语法 : 


油 


(rec name value body) 


举 个 例子 : 


(rec fact 
(lambda (n) (if (= n 0) 1 (*n (fact (- n 1))))) 
(fact 10)) 


它 将 计算 得 到 10 的 阶乘 。 该 语法 糖 解 开会 得 到 : 


(let ([name (box 'dummy)]) 
(begin 
(set-box! name value) 
body ) ) 


这 里 ， 我 们 假设 value 和 body 中 所 有 对 name 的 引用 都 被 改写 为 (unbox name) ; 或 者 换 种 方 
法 ， 我 们 也 可 以 使 用 变量 : 
(let ([name 'dummy]) 
(begin 


(set! name value) 
body)) 


这 自然 就 导致 一 个 问题 : 如 果 我 们 搞 砸 了 顺序 呢 ? 最 有 意思 的 是 ， 如 果 我 们 在 更 新 name 到 实 
际 值 之 前 使 用 它 呢 ?那么 我 们 将 看 到 初始 化 时 系统 给 该 结构 的 无 意义 值 ， 也 就 是 原始 形式 的 
占 位 符 。 


最 简单 可 以 描述 此 问题 的 例子 是 : 


(letrec ([x x]) 
x) 


或 者 等 价 的 : 


(local ([define x x]) 
x) 


在 大 多 数 Racket 变 体 中 ， 这 会 泄露 占 位 符 的 初始 值 一 这 个 值 并 没 打算 给 大 家 使 用 。 麻 烦 的 
地 方 是 ， 这 又 是 个 合法 的 值 ， 这 意味 着 它 至 少 可 以 被 用 于 一 些 计算 中 。 然 而 ， 如 果 无 意 中 访 
问 和 使 用 它 ， 那 么 后 续 的 计算 就 是 瞎 扯 。 


这 个 问题 通常 有 三 种 解决 方案 : 


1， 确保 该 值 足够 模糊 ， 以 至 于 无 法 在 有 意义 的 上 下 文中 使 用 该 值 。 这 意味 着 像 6 这 种 值 就 
不 能 用 ， 事 实 上 语言 中 绝 大 多 数 数据 类 型 都 不 该 用 。 取 而 代 之 ， 语 言 应 该 创建 一 种 新 类 
型 的 值 专 作 此 用 。 将 该 值 传 入 其 它 任 何 操作 都 将 导致 错误 的 抛 出 。 2. 对 于 任意 一 处 标识 
符 的 使 用 ， 明 确 地 检查 其 值 是 否 是 这 个 特殊 的 “过 早 " 值 。 虽 然 这 在 技术 上 有 是 可 行 的 ， 但 它 
会 对 程序 造成 了 巨大 的 性 能 损失 。 因 此 ， 通 常 只 有 教学 语言 这 么 做 。 

2.， 只 人 允许 递归 构造 用 于 绑 定 函数 中 ， 而 且 要 求 该 缚 定 的 右 项 必须 在 语法 上 是 函数 。 不 幸 的 
是 ， 这 个 解决 方案 过 于 激进 ， 比 如 说 它 不 允许 了 我 们 写 出 图 这 样 的 结构 。 


9.4 不 用 到 显 式 的 状态 

聪明 的 你 可 能 想到 ， 还 有 一 种 方法 可 以 定义 递归 函数 (递归 数据 也 是 一 样 ) ， 而 无 需 用 到 显 
式 的 赋值 操作 。 

思考 题 


你 应 该 已 经 明白 ， 当 我 们 使 用 let 来 定义 递归 函数 时 出 了 什么 问题 。 请 再 试 试 。 提 示 : 
需要 更 多 的 替换 。 不 够 再 加 ， 加 满 ! 


仅 使 用 函数 (字面 意思 上 ) 获得 递归 是 个 了 不 起 的 想法 。Daniel P. Friedman 和 Matthias 
Felleisen 在 《The Little Schemer》 一 书 中 很 好 的 描述 了 其 做 法 。 你 可 以 读 一 下 其 在 线 样 章 。 


练习 


这 个 方案 中 用 到 了 状态 吗 ? 有 没有 间接 的 用 到 呢 ? 


10 对 象 


一 门 语言 将 函数 作为 值 ， 就 最 为 自然 地 提供 了 表示 计算 的 最 小 单位 。 假 设 程序 员 需 要 把 某 个 
函数 f 参数 化 。 任 何 语言 都 会 允许 把 被 动 的 数据 一 一 比如 数字 和 字符 串 一 一 用 作 郊 数 参数 。 
但 是 如 果 主 动 的 数据 一 可 以 计算 出 结果 的 数据 ， 比 如 说 响应 某 种 信息 一 也 可 以 用 作 参 
数 ， 这 个 想法 就 很 有 吸引 力 了 。 此 外 ， 作 为 参数 传 给 f 的 函数 一 一 假设 它 遵 从 词法 作用 域 
一 一 可 以 使 用 它 的 调用 者 提供 的 数据 ， 而 这 些 数据 无 需 暴露 给 f ， 这 给 安全 和 隐私 提供 了 基 
石 。 正 因 如 此 ， 遵 从 词法 作用 域 的 函数 成 了 设计 很 多 安全 编程 技术 的 核心 。 








函数 是 好 的 东西 ， 但 是 它 太 过 简洁 。 有 时 候 我 们 希望 多 个 函数 闭合 于 同一 份 共享 的 数据 ; 共 
享 的 意义 在 于 ， 当 这 份 数据 被 其 中 某 个 函数 修改 时 ， 我 们 希望 其 他 函数 能 够 看 到 修改 后 的 结 
果 。 在 这 种 情况 下 ， 不 可 能 仅仅 发 送 一 个 函数 作为 参数 ; 发 送 一 组 函数 更 有 用 。 接 收 方 则 需 
要 能 够 从 这 组 函数 中 提取 出 各 个 函数 。 这 么 一 组 函数 ， 外 加 从 中 选取 函数 的 方法 ， 便 是 对 象 
(object) 的 精 藉 。 我 们 已 经 学 过 了 函数 (第 七 章 ) 和 可 变 结构 (第 八 章 ) ， 现 在 正 是 学 习 对 
象 的 最 佳 时 机 一 同时 前 面 学习 的 递归 (第 九 音 ) 也 将 派 上 用 场 。 





我 们 来 把 此 概念 的 对 象 添 加 到 自己 的 语言 中 。 然 后 我 们 将 不 断 改进 和 扩展 它 ， 从 而 探究 关于 
对 象 系统 设计 的 各 种 维度 。 首 先 展示 一 下 怎么 将 对 象 加 入 到 核心 语言 中 ， 但 是 由 于 想 要 快速 
构建 许多 不 同 的 想法 ， 我 们 很 快 就 会 转向 基于 去 语法 糖 的 策略 。 使 用 哪 种 方式 取决 于 你 是 否 
认为 理解 它们 对 理解 你 的 语言 的 本 质 至 关 重 要 。 判 断 这 点 的 一 种 方法 是 ， 看 你 的 去 语法 糖 过 
程 变 得 有 多 复杂 ， 以 及 ， 在 给 核心 语言 添加 一 些 关键 特性 后 ， 去 语法 糖 的 复杂 度 能 否 大 幅 降 
低 。 


我 不 能 指望 这 里 能 讨论 关于 对 象 系统 的 一 切 ， 你 可 以 阅读 Eric Tanter 的 《 面 对 对 象 编程 语 
言 : 应 用 和 解释 》 来 了 解 更 多 细节 以 及 我 们 没有 涉及 到 的 主题 。 


10.1 不 支持 继承 的 对 象 


最 简单 的 对 象 概念 








可 能 是 唯一 所 有 谈论 对 象 的 人 都 能 认同 的 定义 一 对象 是 : 


。 值 ， 
。 够 将 一 些 名 字 映 射 成 
其 它 东 西 : 值 或 者 "方法 (methods) ” 


从 简约 的 角度 来 看 ， 方 法 似乎 就 是 函数 ， 由 于 我 们 的 语言 已 经 实现 了 函数， 我 们 先 忽略 它们 
之 间 的 区 别 。 


之 后 我 们 会 发 现 “ 方 法 "和 函数 极其 相似 ， 但 是 在 茶 些 重要 的 方面 有 所 不 同 : 调用 方式 ， 还 
有 其 内 部 所 绑 定 的 东西 。 


10.1.1 核心 语言 中 的 对 象 


让 我 们 往 支持 一 等 函数 的 核心 语言 (译注 ， 即 第 七 章 中 实现 的 语言 ) 中 加 入 简单 的 对 象 。 显 
然 我 们 必须 扩展 值 的 概念 : 


(define-type Value 
[numv (n : number)] 
[closV (arg : Symbol) (body : ExprC) (env : Env)] 
[objV (ns : (listof Symbol)) (vs : (listof Value))]) 


还 要 扩展 语法 ， 支 持 对 象 的 构造 表达 式 : 


[objC (ns : (listof symbol)) (es : (listof ExprcC))] 


这 里 语言 的 设计 中 已 做 了 一 个 抉择 。 在 某 些 语言 (如 JavaScript) 中 ， 程 序 员 可 以 直接 写 
出 对 象 。 这 是 个 非常 受 欢 迎 的 概念 ，JavaScript 中 该 功能 的 部 分 语法 成 了 网 络 标准 
JSON 。 在 其 他 语言 (如 Java) 中 ， 对 象 只 能 通过 调用 某 个 类 的 构造 函数 来 创建 。 这 两 种 
设计 我 们 都 可 以 模拟 。 要 模拟 后 一 种 语言 模型 ， 我 们 必须 遵从 后 文 讨论 到 去 语法 糖 中 提 
出 的 程式 化 惯例 ， 只 在 特定 位 置 直 接 写 出 对 象 。 





对 这 个 对 象 表达 式 的 求 值 很 简单 : 对 每 个 表达 式 位 置 都 求 值 就 行 : 


[objC (ns es) (objV ns (map (lambda (e) 
(interp e env)) 


es))] 


不 幸 的 是 ， 我 们 无 法 实际 使 用 对 象 ， 因 为 无 法 获取 其 内 容 。 为 此 ， 我 们 添加 一 个 操作 来 提取 
成 员 : 


[msgC (0 : ExprCc) (n : symbol)] 消息， 核心 语言 


其 行为 就 是 直接 : 


[msgC (o n) (lookup-msg n (interp o env))] 


实现 函数 


; lookup-msg : symbol * Value -> Value 


第 二 个 参数 的 类 型 应 该 是 objv 。 
原则 上 ， msgc 可 以 被 用 于 获取 任意 类 型 的 成 员 ， 但 是 简单 起 见 ， 我 们 假设 成 员 中 只 有 函数 。 
要 使 用 某 个 成 员 ， 需 要 给 其 传 入 参数 值 。 在 核心 语言 的 语法 中 这 么 写 有 点 策 抽 ， 所 以 我 们 假 
设 去 语法 糖 过 程 降低 了 语法 复杂 性 : 表层 语法 中 消息 调用 同时 提供 了 消息 名 和 参数 : 


[msgS (o : ExprS) (n : symbol) (a : ExprS)] ;消息 ， 表 层 语 言 


去 语法 糖 得 msgc 和 有 函数 调用 : 


[msgSs (o n a) (appC (msgC (desugar 0) n) (desugar a))] 


至 此 ， 一 个 包含 对 象 的 语言 就 诞生 了 。 例 如 ， 下 面 是 对 象 定义 和 调用 : 


(letS 'o (objS (list 'addi "sub1) 
(list (lamS 'x (plusS (idS 'x) (numS 1))) 
(lamS 'x (plusS (idS 'x) (numS -1))))) 
(msgS (idS 'o) "add1 (numS 3))) 


它 计算 得 (numV 4) ° 


10.1.2 通过 去 语法 糖 实现 对 象 


在 语言 核心 中 定义 对 象 也 许 是 值得 的 ， 但 是 对 于 学 习 它 来 说 这 么 做 太 麻 烦 了 。 替 代 方 案 是 我 
们 直接 使 用 Racket 语 言 中 那些 我 们 的 解释 器 已 经 实现 过 的 特性 来 表示 对 象 。 也 就 是 说 ， 假 设 
我 们 看 到 的 是 去 语法 糖 后 的 结果 。 (基于 这 个 理由 ， 我 们 会 使 用 程式 化 的 代码 ， 可 能 某 些 表 
达 式 看 上 去 并 不 必要 ， 但 请 注意 这 是 程序 生成 器 输出 的 代码 。) 


注意 : 后 面 所 有 的 代码 都 使 用 #1lang plai ， 而 不 是 typed (静态 类 型 ) 语言 。 
练习 


为 什么 使 用 #1ang plai ?不 然 的 话 ， 在 运行 后 面 的 代码 的 时 候 会 碰 到 什么 问题 ? 这 些 问 
题 好 解决 吗 ， 比 如 引入 新 的 数据 结构 来 保证 代码 类 型 正确 ? 如 果 简 化 我 们 的 模型 呢 ， 比 
如 让 方法 只 接受 一 个 参数 ? 或 者 其 中 有 些 问 题 很 难 解决 ? 


10.1.3 对 象 作为 名 称 集合 


首先 实现 我 们 之 前 实现 的 对 象 语 言 。 对 象 是 对 给 定名 称 进行 分 派 的 一 种 值 。 简 单 起 见 ， 我 们 
用 lambda 表示 对 象 ， 用 case 实现 分 派 : 


(define o-1 
(lambda (m) 
(case m 
[(add1) (lambda (x) (+ x 1))] 
[(sub1) (lambda (x) (- x 1))]))) 


注意 到 这 个 简单 对 象 的 实现 是 泛 化 了 的 lambda ， 带 有 多 个 “入 口 点 "。 相 反 ， lambda 可 
以 理解 为 只 有 一 个 入 口 点 的 对 象 ， 也 因此 它 不 需要 “方法 名 ”。 


这 和 本 章 前 面 的 定义 的 对 象 相同 ， 使 用 其 方法 的 方式 也 相同 : 


(test ((o-1 'add1) 5) 6) ;这 个 测试 会 通过 


当然 ， 这 种 嵌 套 的 函数 调用 有 点 腑 肿 (并 且 将 变 得 更 加 腑 肿 ) ， 所 以 我 们 最 好 提供 一 种 方便 
的 语法 来 调用 方法 一 一 和 前 文 msgs 一 样 ， 不 过 我 们 可 以 简单 将 其 定义 为 函数 : 





(define (msg om . a) 
(apply (oO m) a)) 


ee Racket 的 可 变 参 数目 数 语 法 : ,a 的 意思 是 ， es 零 个 或 多 
绑 定 到 名 为 a 的 链表 。 apply 将 链表 中 的 值 取出 作为 参数 来 进行 函数 调用 。 








这 样 我 们 的 测试 就 可 以 这 么 写 


(test (msg 0-1 "add1 5) 6) 


思考 是 
换 用 去 语法 糖 的 方式 后 ， 有 些 重大 改变 。 你 意识 到 是 什么 吗 ? 
回忆 一 下 之 前 定义 的 语法 : 


[msgC (0o : ExprCc) (n : Symbol)] 


注意 到 消息 “名 字 ” 的 位 置 必须 是 符号 。 即 程序 员 在 该 位 置 必须 字面 写 上 符号 。 而 在 去 语法 糖 的 
版 本 中 ， 名 字 的 位 置 只 是 表达 式 ， 当 然 该 表达 式 必须 计算 得 到 符号 ; 例如， 可 以 这 么 写 : 


(test ((o-1 (string->symbol "add1")) 5) 6) ;这 也 会 通过 


这 是 去 语法 糖 的 常见 问题 : 目标 语言 中 有 些 表达 式 可 能 在 源码 中 没有 对 应 的 表示 ， 于 是 它们 
不 


能 映射 回去 。 幸 运 的 是 ， 通 常 我 们 不 需要 进行 反 向 映射 ， 不 过 某 些 调试 和 程序 分 析 工 具 中 
可 能 需要 这 么 做 。 重 要 的 是 ， 我 们 必须 保证 目标 语言 中 不 会 出 现 无 法 在 源码 中 对 应 的 值 。 


有 了 基本 的 对 象 实现 ， 接 下 来 我 们 添加 那些 大 多 数 对 象 系统 中 都 有 的 特性 。 


10.1.4 构造 器 


构造 器 就 是 在 对 象 构 造 时 调用 的 函数 。 我 们 还 没 定义 过 这 种 函数 。 只 要 将 对 象 从 字面 值 转换 
成 接受 构造 参数 的 函数 ， 便 可 以 达到 效果 : 


(define (o-constr-1 x) 
(lambda (m) 
(case m 
[(addx) (lambda (y) (+ x y))]))) 


(test (msg (o-constr-1 5) 'addx 3) 8) 
(test (msg (o-constr-1 2) 'addx 3) 5) 


在 第 一 个 例子 中 ， 我 们 传 入 5 作为 构造 器 的 参数 ， 所 以 加 3 得 8。 第 二 个 例子 是 类 似 的 ， 这 表明 
构造 器 的 两 次 调用 不 会 相互 干扰 。 


10.1.5 状态 


许多 人 认为 对 象 的 主要 目的 就 是 用 来 封装 状态 。 【注释 】 我 们 当然 保有 这 种 能 力 。 如 果 去 除 
语法 糖 后 的 语言 支持 变量 (当然 支持 box 也 行 ， 代 价 是 去 语法 糖 过 程 会 更 麻烦 些 ) ， 我 们 很 
容易 实现 多 个 方法 对 同一 个 状态 赋值 ， 例 如 修改 构造 参数 : 


(define (o-state-1 count) 
(lambda (m) 
(case m 
[(inc) (lambda () (set! count (+ count 1)))] 
[(dec) (lambda () (set! count (- count 1)))] 
[(get) (lambda () count)]))) 





明 Smalltalk 和 现代 对 象 技 术 而 获得 图 灵 奖 “同意 这 一 观点 。 在 
《Smalltalk 的 早期 历史 》 中 ， 他 说 ，“ 在 Smalltalk 的 早期 历史 中 ， 往 小 了 说 (面向 对 象 纺 
程 的 动机 ) 是 寻找 更 多 用 的 赋值 ， 进 一 步 则 是 尝试 完全 消除 典 值 。 他 补充 说 : “不幸 的 
是 ， 今 天 所 谓 的 ' 面 向 对 象 程 序 设 计 ' 大 部 酒 。 很 多 程序 都 充满 了 ‘赋值 式 
的 "操作 ， 只 不 过 由 更 昂贵 的 附加 子 程序 完成 罢了 。 





可 以 使 用 下 面 的 代码 序列 测试 : 


(test (let ([o (o-state-1 5)]) 
(begin (msg oO 'inc) 
(msg 0 'dec) 
(msg 0 'get))) 
5) 


请 注意 ， 对 一 个 对 象 进行 赋值 不 会 影响 到 另 一 个 对 象 : 


(test (let ([o1 (o-state-1 3)] 
[02 (o-state-1 3)]) 
(begin (msg o1 'inc) 
(msg o1 "inc) 
(+ (msg o1 'get) 
(msg 02 'get)))) 
(+ 5 3)) 


10.1.6 私有 成 员 


另 一 个 常见 的 对 象 语言 特性 是 私有 成 员 : 只 在 对 象 内 部 可 见 ， 外 部 就 不 可 见 。【 注 释 】 看 上 
去 这 个 特性 还 有 待 我 们 去 实现 ， 但 我 们 已 经 有 了 局 部 作用 域 的 、 词 法 绑 定 的 变量 : 


(define (o-state-2 init) 
(let ([count init]) 
(lambda (m) 
(case m 
[(inc) (lambda () (set! count (+ count 1)))] 
[(dec) (lambda () (set! count (- count 1)))] 
[(get) (lambda () count)])))) 


除 此 之 外 ， java ， 相 同类 型 的 其 他 类 的 实例 也 能 访问 "私有" 成员。 否则 就 没 办 法 实现 
抽象 数据 类 型 了 


么 去 除 语 法 糖 之 后 ， 不 存在 访问 count 的 方法 ， 词 法 作用 域 则 确保 它 对 外 部 不 可 见 


10.1.7 静态 成 员 


对 于 对 象 的 使 用 者 来 说 ， 另 一 个 有 用 的 特性 是 静态 成 员 : 所 有 “相同 "类 型 对 象 实例 共享 的 成 
员 。【 注 释 】 实 际 上 ， 这 就 是 (私有 的 ) 词法 范围 标识 符 ， 并 且 位 于 构造 骂 数 之 外 (这 使 其 
对 所 有 构造 函数 的 调用 来 说 都 是 共享 的 ) 


(define o-static-1 
(let ([counter 0]) 
(lambda (amount) 
(begin 
(set! counter (+ 1 counter)) 
(lambda (m) 
(case m 
[(inc) (lambda (n) (set! amount (+ amount n)))] 
[(dec) (lambda (n) (set! amount (- amount n)))] 
[(get) (lambda () amount)] 
[(count) (lambda () counter)])))))) 


这 里 用 引号 是 因为 ， 对 象 有 许多 “相同 "的 概念 。 太 多 了 。 


我 们 把 增加 counter 的 那 行 放 在 该 对 象 的 “构造 器 "所 在 的 位 置 ， 尽管 它 也 可 以 在 方法 内 部 被 操 
纵 和 


测试 就 是 构造 多 个 对 象 ， 并 确保 它们 每 一 个 都 影响 了 全 局 的 count 


(test (let ([o (o-static-1 1000)]) 
(msg 0 "count ) ) 
1) 


(test (let ([o (o-static-1 0)]) 


(msg 0 'count)) 
2) 


10.1.8 带 自 引用 的 对 象 


到 目前 为 止 ， 我 们 的 对 象 还 只 是 打包 的 实名 函数 ; 或 者 你 可 以 这 么 说 ， 有 多 个 实名 入 口 点 的 
函数 。 可 以 看 到 ， 很 多 对 象 系统 中 被 认为 很 重要 的 特性 可 以 通过 函数 和 作用 域 实现 ， 事 实 上 
很 长 一 段 时 间 里 懂得 lambda 的 程序 员 的 确 是 这 么 做 的 ， 只 是 没有 给 这 种 做 法 起 名 字 黑 了 。 


对 象 系统 一 个 不 同 与 众 不 同 的 特征 是 ， 每 个 对 象 都 自 带 了 对 该 对 象 自己 的 引用 ， 通 常 称 
为 self 或 者 this 。【 注 释 】 我 们 可 以 方便 的 实现 这 一 点 吗 ? 


对 象 的 倡导 者 们 经 常 采 用 的 拟人 化 的 术语 * 了 解 自 己 ”， 而 我 更 喜欢 这 种 略 显 枯 燥 的 描述 。 
事实 上 ， 请 注意 ， 我 们 无 需要 求助 于 拟人 化 ， 已 经 描述 了 很 多 对 象 系统 的 属性 了 。 
10.1.8.1 使 用 赋值 实现 自 引 用 


是 的 ， 可 以 这 么 实现 ， 之 前 实现 递归 的 时 候 我 们 已 经 见 过 此 模式 了 ; 只 需要 将 其 一 般 化 ， 引 
用 对 象 自身 而 不 是 box 或 者 函数 : 


(define o-self! 
(let ([self 'dummy]) 


(begin 
(set! self 
(lambda (m) 
(case m 
[(first) (lambda (x) (msg self 'second (+ x 1)))] 
[(second) (lambda (x) (+ x 1))]))) 
Self) ) ) 


可 以 看 见 这 就 是 递归 的 模式 (递归 函数 ) ， 稍 作 调 整 。 在 方法 first 中 使 用 自 引 用 调用 了 方 
法 second 。 测 试 表 明 这 么 做 可 行 : 


(test (msg o-self! 'first 5) 7) 


10.1.8.2 不 用 赋值 实现 自 引 用 


如 果 你 研究 过 怎么 不 使 用 赋值 实现 递归 ， 那 么 你 会 发 现 该 方案 也 适用 于 这 里 。 


(define o-self-no! 
(lambda (m) 
(case m 
[(first) (lambda (self x) (msg/self self 'second (+ x 1)))] 
[(second) (lambda (self x) (+ x 1))]))) 


现在 每 个 方法 需要 传 入 self 参数 。 这 意味 着 方法 调用 也 需要 修改 ， 以 遵循 新 模式 : 


(define (msg/self o m . a) 
(apply (oO m) 0 a)) 


也 就 是 说 ， 当 调用 对 象 o 的 方法 时 ， 必 须 把 o 作为 参数 传递 给 方法 。 显 然 这 种 方式 存在 隐 
患 ， 调 用 方法 的 时 候 可 以 传 入 不 同 的 对 象 作 为 self 。 因 此 将 这 个 功能 提供 给 程序 员 可 能 是 个 
坏 主意 ; 如 果 使 用 这 种 技术 ， 则 只 能 通过 去 语法 糖 来 实现 。 


尽管 如 此 ，Python 还 是 在 其 表层 语法 中 这 么 做 了 。 尽 管 这 种 致敬 Y-combinator 的 行为 令 
人 感动 ， 但 是 由 此 带 来 的 脆弱 性 也 许 不 必要 。 


10.1.9 动态 分 发 


最 后 ， 我 们 希望 我 们 的 对 象 可 以 处 理 对 象 系统 的 这 个 特性 ， 调 用 者 可 以 进行 方法 调用 ， 而 无 
需 知道 或 者 决定 哪个 对 象 会 处 理 该 调用 。 假 设 我 们 有 个 二 又 树 数 据 结 构 ， 树 中 要 么 是 不 含 值 
的 节点 或 者 含 值 的 叶 节 点 《译注 : 原文 如 此 ， 和 后 面 的 代码 有 相反 之 处 ) 。 传 统 的 函数 中 ， 
我 们 需要 借助 某 种 形式 的 条 件 判断 cond 、 type-case 、 模 式 匹 配 ， 或 与 之 等 价 的 东西 
一 一 穷 举 不 同形 式 的 树 并 根据 对 应 形式 来 选择 执行 。 如 果树 的 定义 扩展 了 ， 包 侈 了 新 的 类 
型 ， 那 么 所 有 相应 的 代码 段 必 须 修 改 。 动 态 分 发 (dynamic dispatch) 将 该 条 件 选 择 移 到 语言 
内 部 ， 使 得 用 户 程序 可 以 不 用 处 理 这 种 情况 ， 从 而 解决 此 问题 。 它 提供 的 关键 特性 是 可 扩展 
的 条 件 。 这 也 是 对 象 提供 的 可 扩展 性 的 一 个 方面 。 





动态 分 发 使 得 系统 具有 黑 盒 可 扩展 性 ， 因 为 系统 的 某 个 部 分 可 以 在 不 能 及 其 他 部 分 ( 代 
码 修 改 ) 的 情况 下 扩展 ， 这 个 属性 也 被 认为 是 面向 对 象 编程 的 一 大 好 处 。 这 的 确 是 对 象 

相 比 防 数 的 优势 ， 然 而 函数 相 比 对 象 有 个 对 等 的 优势 ， 事 实 上 很 多 对 象 程序 员 使 用 访问 

者 模式 (Visitor pattern) 来 组 织 代码 ， 使 其 看 起 来 更 像 函 数 式 的 。 请 参阅 Synthesizing 

Object-Oriented and Functional Design to Promote Re-Use ， 其 中 包括 有 具体 的 例子 ， 给 
出 此 问题 的 完整 描述 。 试 着 用 你 最 喜欢 的 语言 解决 这 个 问题 ， 然 后 可 以 看 看 Racket 中 的 
解决 方案 。 


先 来 定义 两 种 类 型 的 树 对 象 : 


(define (mt) 
(let ([self 'dummy]) 
(begin 
(set! self 
(lambda (m) 
(case m 
[(add) (lambda () 9)]))) 
self))) 


(define (node v 1 r) 
(let ([self 'dummy]) 


(begin 
(set! self 
(lambda (m) 
(case m 
[(add) (lambda () (+ V 

(msg 1 'add) 
(msg r 'add)))]))) 

self))) 


于 是 ， 我 们 可 以 构造 具体 的 树 : 


(define a-tree 
(node 10 
(node 5 (mt) (mt)) 
(node 15 (node 6 (mt) (mt)) (mt)))) 


最 后 ， 测 试 一 下 : 


(test (msg a-tree 'add) (+ 10 5 15 6)) 


注意 到 ， 在 测试 案例 中 ， 还 有 在 node 的 add 方法 中 ， 都 调用 了 add 方法 而 没有 检查 接收 方 
是 mt 还 是 node 。 运 行 时 系统 提取 出 接收 方 的 add 方法 并 执行 。 用 户 的 程序 中 没有 条 件 表达 
式 ， 这 正 是 动态 分 发 的 精髓 。 


10.2 成 员 访 问 的 设计 空间 


对 于 成 员 名 称 的 处 理 我 们 已 经 有 两 个 正 交 的 纬度 。 一 个 维度 是 名 字 是 静态 给 定 还 是 计算 给 出 
的 ， 另 一 纬度 是 名 字 的 集合 是 固定 的 还 是 可 变 的 : 


名 字 是 静态 的 名 字 是 计算 求 得 的 
成 员 固 定 基本 的 Java Java 中 通过 反射 计算 出 的 名 字 
成 员 可 变 无 法 想象 大 部 分 脚本 语言 


只 有 一 种 情况 毫 无 意义 : 如 果 强 制程 序 员 在 源码 中 显 式 指定 成 员 名 ， 那 么 就 无 法 添加 新 的 可 
访问 的 成 员 了 (当然 ， 访 问 曾经 存在 过 但 是 被 删除 的 成 员 还 是 会 报错 ) 。 其 它 的 几 种 情况 都 
已 经 在 各 种 语言 中 被 尝试 过 了 。 


右 下 方 那 种 情况 密切 对 应 于 那些 使 用 哈 希 表 表 示 对 象 的 语言 。 成 员 名 字 即 哈 希 表 的 索引 。 一 
些 语言 将 这 种 风格 推 到 极限 ， 当 索引 是 数字 时 也 同样 处 理 ， 于 是 对 象 和 和 字典 (甚至 数组 ) 

都 混 到 了 一 起 。 即 使 对 象 只 处 理 "成 员 名 字 ”， 这 种 风格 的 对 象 也 给 类 型 检查 带 来 极 大 困难 ， 这 
可 不 是 什么 好 事 。 


因此 ， 本 章 的 其 余部 分 ， 我 们 将 坚持 使 用 “传统 的 "对 象 ， 成 员 固 定 ， 甚 至 会 让 它 的 名 字 只 能 是 
静态 的 (对 应 于 左上 角 那 种 ) 。 即 使 这 样 ， 我 们 将 发 现 仍 有 很 多 待 学 习 的 东西 。 


10.3 还 有 点 哈 (else 中 放 什 么 ) ? 


截至 目前 ， 我 们 的 case 表达 式 并 不 包含 else 子 句 。 这 人 么 做 的 一 个 原因 是 ， 方 便 使 得 我 们 的 

成 员 (及 成 员 数 量 ) 可 变 ; 尽管 前 面 我 们 也 讨论 过 ， 使 用 其 它 方式 实现 ， 例 如 哈 希 表 ， 可 能 

是 更 好 的 选择 。 相 反 ， 假 如 对 象 成 员 固 定 ， 把 对 象 去 语法 糖 实现 为 条 件 表 达 式 从 演示 的 角度 

来 讲 很 合理 ( 因为 这 种 实现 方式 强调 了 成 员 名 称 固定 这 一 点 ， 而 哈 希 表 实 现 就 将 这 一 点 交 给 

了 解释 器 ， 这 么 做 容易 导致 错误 ) 。 不 过 ， 还 有 一 个 很 好 的 原因 ， 需 要 用 上 else 子 句 : 继承 
(inheritance) 。 它 指 的 是 ， 将 控制 " 链 式 地 " 交 给 另 一 个 对 象 ， 称 为 父 对 象 。 


还 是 从 前 文中 去 语法 糖 对 象 模 型 开始 。 为 了 实现 继承 ， 需 要 提供 给 对 象 “ 某 种 东西 "， 当 遇 到 其 
识别 不 了 的 方法 ， 委 托 它 实现 。“ 某 种 东西 "怎么 选择 将 导致 过 蜡 的 设计 结果 。 


一 种 简单 的 选择 ， 男 一 个 对 象 。 


(case m 


[else (parent-object m)]) 


基于 我 们 的 实现 ， 这 么 做 的 话 ， 我 们 将 在 父 对 象 中 搜索 当前 对 象 中 不 存在 的 方法 (并 且 递 归 
的 搜索 父 对 象 的 父 对 象 ) 。 如 果 找 到 与 名 称 对 应 的 方法 ， 那 么 方法 就 会 链 式 的 返回 最 初 
的 msg 调用 。 如 果 找 不 到 方法 ， 最 后 那个 对 象 可 以 报错 “未 找到 消息 "。 


练习 


注意 到 调用 (parent-object m) 就 像 “ 半 个 msg "一 样 ， 和 左 值 是 “ 半 个 查找 ”类似 。 两 者 有 
什么 联系 吗 ? 


让 我 们 来 试 试 这 个 想法 ， 扩 展 我 们 的 树 实现 另 一 方法 size 。 我 们 通过 给 对 象 node 和 mt 分 
别 实现 “扩展 ”( 你 可 能 想 叫 它 “ 子 类 ”， 但 现在 请 先 忍 住 ) 的 方式 实现 ， 也 就 是 使 用 前 述 的 模 
式 。 
这 里 不 会 对 现 有 的 定义 做 任何 编辑 ， 这 正 是 对 象 继承 的 意义 所 在 : 以 黑 盒 的 形式 重用 代 
码 。 这 意味 着 ， 彼 此 不 认识 的 各 方 可 以 各 自 扩 展 相同 的 基本 代码 。 如 果 他 们 必须 编辑 基 
本 代码 ， 首 先 他 们 必须 知道 对 方 的 修改 ， 此 外 ， 某 一 方 可 能 不 喜欢 另 一 方 做 的 编辑 。 继 
承 就 可 以 完全 避 开 这 种 麻烦 。 


10.3.1 类 
我 们 立刻 就 遇 到 了 难题 。 构 造 器 的 模式 是 这 样 的 吗 ? 


(define (node/size parent-object v 1 r) 


这 段 代码 表明 ， 父 对 象 和 对 象 构造 器 的 其 他 参数 处 于 "同一 级 别 ”。 这 看 上 去 很 合理 ， 只 要 所 有 
这 些 参 数 都 给 定 了 ， 该 对 象 也 就 被 "完全 定义 "了 。 然 而 ， 我 们 的 代码 中 还 有 : 


(define (node v 1 r) 


我 们 需要 把 所 有 的 参数 写 两 遍 吗 ? ( 当 有 什么 相同 的 东西 需要 写 两 次 ， 应 该 考虑 一 下 我 们 是 
不 是 有 啥 地 方 没有 保持 一 致 ， 因 此 引入 了 微妙 的 错误 。) 以 下 是 替代 方案 : node/size 可 以 
构造 其 父 对 象 的 实例 。 也 就 是 说 ， 传 给 node/size 指明 父 对 象 的 参数 不 是 父 对 象 本 身 ， 而 是 
父 对 象 的 构造 函数 : 


(define (node/size parent-maker v 1 r) 
(let ([parent-object (parent-maker v 1 r)] 
[self 'dummy]) 


(begin 
(set! self 
(lambda (m) 
(case m 
[(size) (lambda () (+ 1 
(msg 1 'size) 
(msg r 'size)))] 
[else (parent-object m)]))) 
Self) ) ) 


(define (mt/size parent-maker ) 
(let ([parent-object (parent-maker )] 
[self :dummy]) 


(begin 
(set! self 
(lambda (m) 
(case m 
[(size) (lambda () 0)] 
[else (parent-object m)]))) 
Self) ) ) 


每 次 调用 对 象 构造 器 的 时 候 ， 就 必须 要 记得 传 入 父 对 象 的 构造 函数 


(define a-tree/size 
(node/size node 
10 
(node/size node 5 (mt/size mt) (mt/size mt)) 
(node/size node 15 
(node/size node 6 (mt/size mt) (mt/size mt)) 
(mt/size mt)))) 


显然 我 们 可 以 通过 合适 的 语法 糖 简化 上 面 这 一 堆 东 西 。 写 两 个 测试 来 确保 原 功 能 和 新 加 功能 
都 正确 : 


(test (msg a-tree/size 'add) (+ 10 5 15 6)) 
(test (msg a-tree/size 'size) 4) 


练习 
把 这 段 代码 改写 成 self 调 用 模式 的 ， 不 使 用 赋值 【第 10.1.8.2 节 ) 


这 里 展示 的 就 是 类 (class) 的 精髓 。 给 函数 加 上 父 参 数 后 它 就 是 ...... 好 吧 ， 卜 的 有 点 琼 手 。 
a 它 称 为 blob (难以 名 状 的 一 团 ) 。blob 对 应 于 Java 程 序 员 在 编写 类 时 定义 的 内 


入 


class NodeSize extends Node { ... } 


那么 ， 为 什么 我 们 不 把 它 叫 做 “类 ” 呢 ? 


当 程 序 员 调 用 Java 的 类 构造 器 时 ， 它 实际 上 构造 了 继承 链 上 的 所 有 对 象 〈 当 然 ， 编 译 器 可 能 
会 对 此 优化 ， 只 需要 进行 一 次 构造 器 调用 和 一 次 对 象 分 配 ) 。 每 个 父 类 都 会 对 应 创建 一 个 私 
有 的 对 象 ( 对 于 静态 方法 来 说 是 私有 的 ) 。 问 题 是 ， 这 些 对 象 中 有 多 少 是 可 见 的 。Java 的 选 
择 和 我 们 上 述 的 实现 不 同 ， 是 对 于 每 个 给 定名 字 (和 签名 ) 的 方法 只 保留 一 个 ， 不 管 该 方法 
在 继承 链 上 被 实现 了 多 少 次 ， 而 所 有 的 字段 都 被 保留 ， 可 以 通过 强制 类 型 转换 去 访问 。 后 者 
细 想 是 合理 的 ， 因 为 对 字段 来 说 ， 可 能 会 有 一 些 基于 它 的 不 变量 ， 所 以 保证 它们 彼此 分 离 
(因此 所 有 字段 都 存在 ) 是 很 有 必要 的 。 相 比 之 下 ， 很 容易 想 出 来 一 种 方式 可 以 使 所 有 方法 
可 用 ， 而 不 仅 是 继承 层次 中 最 低 ( 即 最 精炼 ) 的 方法 。 很 多 脚本 语言 采用 这 种 方法 。 
练习 
前 面 的 代码 犯 了 一 个 本 质 错误 。 self 引用 的 是 同一 个 语法 上 的 对 象 ， 而 它 需 要 引用 的 是 
最 精炼 (继承 层次 中 最 低 ) 的 对 象 : 这 个 问题 被 称 为 开放 式 递 具 (open recursion ) 
【注释 】 修 改 对 象 的 表示 法 ， 使 得 self 总 是 引用 对 象 最 精炼 的 版 本 。 提 示 : 你 会 发 现 ， 
self 调 用 的 方式 (10.1.8.2 节 ) 更 方便 。 


[e) 


这 展示 了 从 传统 对 象 获 得 的 另 一 种 可 扩展 性 形式 : 可 扩展 递归 (extensible 
recursion ) 。 


10.3.2 原型 


在 前 文 的 描述 中 ， 我 们 给 每 个 类 提供 了 其 父 类 的 描述 。 构 造 对 象 时 将 沿 着 继承 链 创 建 每 个 类 
的 实例 。 关 于 父 代 还 有 一 种 想法 : 它 不 是 需要 实例 化 的 类 ， 而 就 是 对 象 本 身 。 这 样 拥有 相同 
父 代 的 子 代 都 会 看 到 同一 个 对 象 ， 这 意味 着 从 某 个 子 对 象 中 修改 该 对 象 内 部 状态 将 对 其 它 子 
对 象 可 见 。 该 共有 对 象 被 称 为 原型 (prototype) 。 
代表 性 的 基于 原型 的 语言 是 Self。 虽 然 你 可 能 听 说 过 JavaScript 是 “基于 ?Self 的 ， 但 是 从 其 
源头 来 研究 这 个 想法 是 有 意义 的 ， 而 且 Self 展 示 了 原型 这 个 概念 最 纯粹 的 形式 。 
一 些 语 言 设 计 者 认为 原型 比 类 更 为 基础 ， 因 为 原型 (外 加 语言 中 的 其 他 基本 机 制 ， 比 如 函 
数 ) 可 以 实现 类 一 但 是 反之 则 不 行 。 前 面 我 们 基本 上 就 是 这 么 做 的 : 每 个 “类 "函数 中 都 包含 
了 对 对 象 的 描述 ， 所 以 类 就 是 返回 对 象 的 函数 。 如 果 我 们 假设 这 是 两 个 不 同 的 操作 ， 直 接 继 
承 对 象 ， 我 们 将 得 到 类 似 原型 的 东西 。 
练习 
修改 继承 模式 ， 实 现 类 似 Self 的 、 基 于 原型 的 语言 ， 而 不 是 基于 类 的 语言 。 因 为 类 为 每 个 
对 象 提供 其 父 对 象 的 不 同 拷贝 ， 所 以 基于 原型 的 语言 可 以 提供 克隆 操作 ， 从 而 简化 在 原 
型 上 模拟 类 的 操作 。 


10.3.3 多 重 继承 


你 可 能 会 想到 ， 为 什么 (方法 在 本 对 象 中 找 不 到 时 ) 只 提供 一 个 选项 呢 ? 很 容易 把 这 个 推广 
到 多 个 选项 的 情况 ， 这 也 很 自然 的 导出 多 重 继承 (multiple inheritance) 。 有 多 个 父 莫 之 后 很 
显然 的 问题 是 ， 查 找 方法 时 按照 何 种 顺序 进行 。 继 承 关系 组 织 成 树 状 结构 ， 火 糕 的 是 ， 并 没 
有 权威 的 顺序 可 供 使 用 : 比如 是 深度 优先 呢 还 是 广度 优先 呢 (两 种 做 法 都 能 找到 论据 支 

持 ) 。 更 糟糕 的 是 ， 例 如 blob A 扩展 自 B 和 C ; 而 B 和 C 都 扩展 自 D。【 注 释 】 问 题 来 了 : A 的 
实例 中 包含 一 个 还 是 两 个 D 对 象 呢 ? 只 包含 一 个 既 节 省 空间 且 行 为 可 能 更 符合 期 望 ， 那 么 ， 访 
问 该 对 象 时 是 访问 一 次 还 是 两 次 呢 ? 两 次 访问 之 间 应 该 没有 什么 区 别 ， 所 以 似乎 没有 必要 。 
但 一 次 访问 意味 着 B 或 C 之 一 的 行为 可 能 会 改变 。 诸 如 此 类 。 结 果 ， 几 乎 每 一 个 支持 多 重 继承 
的 语言 都 伴随 着 一 个 微妙 的 算法 ， 仅 仅 是 定义 查找 的 顺序 。 


这 就 是 臭名 昭著 的 鞭 形 继承 (diamond inheritance ) 问题 。 如 果 你 选择 在 语言 中 包含 多 
重 继承 ， 关 于 这 个 问题 涉及 的 设计 抉择 可 能 需要 你 纠结 好 长 时 间 。 你 几乎 不 可 能 找到 规 
范 的 解决 方案 ， 所 以 你 的 痛苦 才刚 刚 开始 。。 


多 重 继承 只 有 在 你 思考 之 前 才 有 吸引 力 。 


10.3.4 (高 超 的 ) Super 


很 多 语言 中 支持 super 调 用 ， 即 调用 继承 链 上 一 层 中 的 方法 或 者 访问 上 一 层 中 的 字段 。【 注 
释 】 包 括 在 对 人 象 构造 的 时 候 这 样 做 ， 在 那里 通常 需要 调用 所 有 的 构造 函数 ， 以 确保 对 象 被 正 
确定 义 。 


注意 这 里 说 的 是 " 链 "。 在 多 重 继承 的 情况 下 这 些 概 念 要 复杂 的 多 。 


我 们 已 经 对 向 “上 ”调用 习以为常 ， 也 许 我 们 忘 了 问 这 是 否 是 最 自然 的 方向 。 请 记 住 ， 构 造 器 和 
方法 的 任务 是 维护 不 变量 。 我 们 应 该 更 信任 谁 ， 超 类 还 是 子 类 ? 有 些 人 认为 ， 子 类 更 为 精 
炼 ， 所 以 它 拥有 关于 对 象 最 全 面 的 描述 。 但 反 过 来 说 ， 超 类 必须 保护 其 不 变量 不 受 无 知 的 子 
类 胡乱 鞭 改 。 
这 是 关于 继承 到 底 是 什么 的 两 种 截然 不 同 的 认 知 。 向 上 意味 着 我 们 认为 扩展 是 要 替代 超 类 。 
向 下 意味 着 我 们 认为 扩展 是 改善 父 代 。 通 常 我 们 将 子 类 继承 视 为 后 者 (改善 和 精炼 ) ， 但 是 
为 什么 我 们 的 语言 进行 调用 的 时 候 却 选择 了 “错误 的 "方向 呢 ? 因此 ， 有 些 语言 探索 了 默认 向 下 
调用 。 

gbeta 是 一 门 由 众多 有 趣 特 性 的 现代 语言 ， 它 支持 inner ( 即 向 下 调用 ) 。 考 虑 结合 这 两 

个 方向 也 是 非常 有 趣 的 。 


10.3.5 Mixin 和 Trait 


回 过 头 讨 论 我 们 的 “blob”。 


在 Java 中 当 我 们 写 下 一 个 “类 ?时 候 ， 那 对 大 括号 中 事实 上 是 什么 东西 呢 ? 它 不 是 完整 的 类 : 完 
整 的 类 取决 父 类 ， 那 又 递归 的 取决 于 它 的 父 类 。 其 实 ， 我 们 在 大 括号 内 定义 的 是 类 的 扩展 。 
仅 当 在 这 个 定义 中 加 入 父 类 后 ， 它 才 是 个 完整 的 类 。 


自然 我 们 要 问 : 为 什么 ?为 什么 不 把 扩展 的 定义 和 将 扩展 应 用 于 基 类 这 两 个 行为 分 开 呢 ? 
即 ， 将 这 段 代 码 : 


Class Cextends BSA 小 


classext ER 


和 


class C = E(B) 


其 中 B 是 某 个 定义 好 的 类 。 


看 上 去 这 样 好 像 只 是 用 更 长 的 代码 实现 一 样 的 东西 。 但 是 这 种 类 似 函 数 调用 的 语法 不 禁 让 我 
们 浮想 联翩 : 可 以 将 菜 个 扩展 "应 用 "于 多 个 不 同 的 基 类 。 比 如 说 : 


class C1 = E(B1); 
class C2 = E(B2); 
/oA 


诸如 此 类 。 通 过 将 EE 的 定义 和 其 扩展 的 类 分 离开 ， 我 们 将 扩展 从 固定 基 类 的 暴政 中 解放 出 来 。 
这 种 扩展 有 个 名 字 : mixin 。 


“mixin" 一 词 起 源 于 Common Lisp， 是 多 重 继承 的 特定 使 用 模式 。 鸡 富里 飞 出 金 凤 凰 。 


Mixin 使 得 类 定义 具有 更 好 的 组 合 性 。 它 提供 了 很 多 多 重 继承 的 好 处 (重用 多 段 功 能 代码 ) ， 
但 是 避免 了 多 重 继承 的 麻烦 (例如 没有 前 面 讨论 的 复杂 的 查询 顺序 问题 ) 。 采 用 去 语法 糖 的 
方式 的 话 ，mixin 还 非常 容易 实现 。Mixin 基 本 上 就 是 “类 的 函数 "。 我 们 的 目标 语言 支持 函数 ， 
而 且 已 经 确定 了 类 去 语法 糖 后 的 表达 式 ， 该 表达 式 可 以 放 入 函数 中 ， 这 意味 着 实现 简单 的 
mixin 模 型 非常 容易 。 


这 里 的 情况 是 ， 去 除 语 法 糖 后 的 目标 语言 拥有 良好 的 通用 性 ， 如 果 我 们 将 其 映射 回 源码 
语言 ， 就 能 获得 更 好 的 结构 。 

在 静态 类 型 语言 中 ， 好 的 mixin 设 计 完 全 可 以 改善 面向 对 象 编程 的 实践 。 假 设 我 们 要 定义 一 个 
基于 mixin 的 Java。 如 果 mixin 等 效 于 类 到 类 的 函数 ， 那 么 这 个 “函数 ”的 “类 型 "是 什么 ?了 显然 ， 
mixin 应 该 使 用 接口 (interface) 来 描述 其 输入 和 输出 。Java 支 持 后 者 (但 不 强制 要 求 ) ， 但 
是 不 支持 前 者 : 类 (的 扩展 ) 扩展 的 是 另 一 个 类 一 一 这 个 类 中 所 有 的 成 员 对 扩展 都 是 可 见 的 
一 一 而 不 是 其 接口 。 这 意味 着 子 类 获取 了 父 类 所 有 的 行为 ， 而 不 是 其 规范 。 如 果 修 改 父 类 ， 
就 有 可 能 导致 子 类 出 错 。 


在 支持 mixin 的 语言 中 ， 我 们 就 可 以 这 么 写 : 


mixin M extends I { ,.，} 


其 中 | 是 接口 。 这 样 M 可 以 用 来 扩展 实现 了 接口 | 的 类 ， 语 言 能 保证 只 有 I 中 指定 的 成 员 在 M 中 可 
见 。 这 就 遵循 了 好 的 软件 设计 的 重要 原则 之 一 。 
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“面向 接口 编程 ， 而 不 是 面向 实现 (Program to an interface, not an implementation ) 


一 一 《设计 模式 》 


好 的 mixin 设 计 还 可 以 更 进一步 。 按 照 定义 ， 一 个 类 在 继承 链 中 只 能 使 用 一 次 (如 果 某 个 类 的 
引用 它 自己 ， 那 么 vy 这 会 导致 无 限 循 环 ) 。 反 之 ， 当 我 们 编写 函数 

时 ， 就 不 会 有 这 种 顾虑 (例如 : (map ... (filter (map ...))) ) 。 使 用 某 个 mixin 两 次 有 意义 
吗 ? 


当然 有 ! 请 参阅 Classes and Mixins 的 第 3 和 第 4 节 。 


mixin 解 决 了 库 设计 中 出 现 的 一 个 重要 问题 。 假 设 我 们 有 十 几 个 不 同 的 特性 可 以 用 不 同 的 方式 
进行 组 合 ， 我 们 应 该 提供 多 少 个 类 ?更 其 之 ， 并 不 是 所 有 特性 都 可 以 相互 组 合 。 显 然 ， 产 生 
所 有 组 合 对 应 的 类 不 现实 。 更 好 的 方案 是 允许 程序 员 选 择 他 们 关心 的 特性 ， 且 提供 必要 的 机 
制 防止 不 合理 的 组 合 。 这 正 是 mixin 所 解决 的 问题 : mixin 提 供 类 的 扩展 ， 程 序 员 可 以 自行 组 
合 ， 而 接口 必须 要 能 对 上 ， 从 而 创建 自己 需要 的 类 。 


Racket 的 GUI 库 中 广泛 使 用 了 mixin。 例 如 color:text-mixin 的 输入 是 基本 的 文本 编辑 器 
接口 ， 输 出 是 彩色 的 文本 编辑 器 接口 。 后 者 本 身 也 是 一 种 基本 的 文本 编辑 器 接口 ， 于 是 
其 他 基本 文本 相关 的 mixin 还 可 以 继续 应 用 于 其 输出 。 


练习 

你 最 喜欢 的 面向 对 象 语 言 的 库 是 是 怎么 解 笠 决 上 述 问题 页 的 ? 
Mixin 也 有 局 限 : 只 能 进行 线性 的 组 合 。 这 种 限制 有 时 会 给 程序 员 带 来 不 必要 的 负担 。 将 mixin 
泛 化 ， 不 是 只 对 单个 ee ,而 是 扩展 一 组 mixin， 这 被 称 为 trait。 当 然 ， 允 许 扩展 多 个 就 
必须 要 处 理 潜在 的 名 字 冲 突 。 因 此 实现 trait 必 须 同时 提供 解决 名 字 冲 突 的 机 制 ， 通 常 是 某 种 名 


称 组 合 代 数 。Trait 是 mixin 的 补充 ， 程 序 员 可 以 自行 选择 最 满足 其 需求 的 机 制 。Racket 支 持 
mixin 和 trait 。 


11 内 存 管理 


11.1 垃圾 


垃圾 (garbage) 指 的 是 已 分 配 但 是 不 再 需要 的 内 存 。 典 型 的 编程 语言 的 运行 时 系统 采用 两 种 
不 同 的 内 存 分 配方 式 。 一 种 是 分 配给 环境 ; 这 种 分 配方 式 要 和 静态 作用 域 保 持 一 致 ， 所 以 它 
只 需要 支持 推 入 (push) 和 弹出 (pop) 操作 。 函 数 调 用 返回 时 ， 为 其 环境 分 配 的 空间 也 被 返 
回 ， 供 后 续 函 数 使 用 ， 看 似 没 有 成 本 。【 注 释 】 与 之 相对 ， 在 贮存 中 分 配 的 内 存 必须 伴随 某 
个 值 的 一 生 ， 可 能 要 超过 其 创建 位 置 的 作用 域 事实 上 ， 它 可 能 一 直 存 活 下 去 。 因 此 ， 我 
们 需要 不 同 的 策略 来 回收 在 贮存 中 分 配 空间 所 产生 的 垃圾 。 





并 非 没 有 成 本 。 硬 件 必 须 执行 “弹出 指令。 这 不 见得 就 一 定 比 其 他 内 存 管 理 策略 更 高 效 。 


空间 回收 的 方法 有 很 多 ， 大 体 可 以 分 到 两 个 阵营 中 : 人 工 和 自动 。 人 工 的 方式 依赖 于 开发 者 
能 够 了 解 内 存 的 使 用 ， 并 正确 的 释放 不 需要 的 内 存 。 一 般 认 为 ， 人 并 不 擅长 做 这 种 事 (虽然 
在 某 些 情况 下 ， 人 类 拥有 机 器 所 无 法 获取 的 知识 ) 。 因 此 ， 几 十 年 来 ， 自 动 化 的 方法 越 来 越 


11.2 什么 样 的 垃圾 回收 是 “正确 的 ”? 


垃圾 回收 既 不 应 该 太 早 地 收回 空间 (可 靠 性 ，soundness) 也 不 能 太 晚 (完备 性 ， 
completeness) 。 虽 然 两 者 都 可 以 被 视 为 缺陷 ， 但 是 它们 的 影响 并 不 是 对 称 的 : 可 以 说 ， 过 
早 收回 糟糕 得 多 。 这 是 因为 ， 如 果 过 旱 回 收 了 茶 个 贮存 地 址 ， 计 算 将 继续 ， 并 可 能 将 其 他 数 
据 写 入 该 地 址 ， 从 而 访问 到 无 意义 的 数据 。 往 好 了 说 ， 这 会 导致 程序 不 正确 ， 极 端 情况 下 后 
果 更 严重 ， 比 如 可 能 会 导致 安全 问题 。 反 之 ， 过 迟 收回 会 导致 性 能 损失 ， 并 且 可 能 最 终 导 致 
程序 终止 ， 尽 管 此 时 存在 理论 上 可 用 的 内 存 。 这 种 性 能 损失 以 及 程序 过 早 终止 很 令 人 讨厌 ， 
在 某 些 关键 任务 系统 中 可 能 会 导致 重大 问题 ， 不 过 ， 至 少 程序 不 会 进行 无 意义 的 运算 。 


理想 情况 下 ， 我 们 希望 拥有 所 有 的 这 三 项 : 自动 化 (automation) ， 可 靠 性 和 完备 性 。 然 
而 ， 这 里 我 们 面 对 的 是 不 可 兼 得 的 情形 ， 最 多 只 能 选择 两 项 。 理 想 的 人 类 能 够 做 到 可 靠 性 和 
完备 性 ， 但 实践 中 实现 其 中 一 个 都 很 少见 。【 注 释 】 计 算 机 可 以 实现 自动 化 ， 同 时 可 以 提供 
可 靠 性 和 完备 性 中 的 一 个 ， 但 可 计算 性 论证 表明 ， 自 动 化 的 计算 过 程 不 能 同时 达成 这 两 者 。 
实践 中 ， 自 动 化 技术 一 般 选 择 实现 可 靠 性 ， 出 于 以 下 原因 : (a) 它 造 成 的 损害 最 小 ; (b) 
它 相对 更 容易 实现 ; (Cc) 在 添加 一 些 人 工 帮助 的 情况 下 ， 可 以 接近 完备 性 。 


你 当然 是 完美 的 ， 但 是 你 的 程序 员 同 行 呢 ?顺便 说 一 下 ， 经 济 学 理论 在 等 你 验证 呢 。 


11.3 人 工 回 收 


人 工 的 最 彻底 的 方式 是 将 所 有 内 存 回收 交 由 人 操作 。 例 如 ， 在 C 语 言 中 提供 了 两 个 基本 指 
令 : malloc 用 于 分 配 内 存 ” free 用 于 释放 内 存 ° malloc 的 输入 是 (内 存 的 ) 大 小 ， 返回 是 
对 贮存 的 引用 ; free 的 输入 是 这 种 引用 ， 释 放 其 占用 的 内 存 。 





“在 当代 欧美 语言 ， "Moloch" 摩 洛 这 个 词 有 特定 的 引申 义 ， 指 代 需 要 极 大 牺牲 的 人 物 或 者 事业 。 
[维基 百科 ， 摩 洛 词 条 ] (http://en.wikipedia.org/wiki/Moloch) 
“我 不 认为 这 个 名 字 听 起 来 像 malloc 是 巧合 。” 一 Ian Barland 


11.3.1 完全 人 工 回 收 的 代价 


先 来 考虑 一 下 这 些 操作 的 复杂 度 。 首 先 我 们 假设 malloc 有 个 指向 贮存 的 关联 寄存 器 (上 比 

如 new-loc ) ， 每 次 分 配 的 时 候 直接 获取 下 一 个 可 用 地 址 。 这 个 模型 非常 简单 一 “可 惜 只 是 
看 上 去 简单 而 已 。 问 题 出 在 当 你 需要 用 free 释放 内 存 时 。 如 果 调 用 free 针对 的 是 最 后 一 
次 malloc 分 配 的 内 存 ， 那 么 。 ; ee es Be a 。 如 果 释 放 的 不 
是 最 新 分 配 的 内 和 存 ， 将 会 在 贮存 中 留 洞 。 空 洞 会 导致 碎片 化 (fragmentation) ， 最 坏 的 
配 任何 对 象 一 许多 分 割 的 碎片 ， 没 有 一 个 足 
够 大 。 


练习 


原则 上 ， 我们 可 以 通过 使 所 有 室 余 室 间 相 邻 来 解决 帮 片 化 的 问题 怎么 达成 这 一 点 ? 全 
细 考 虑 所 有 的 后 果 ， 然 后 描述 一 下 如 何 手工 进行 这 项 工作 。 


在 大 多 数 手动 内 存 管理 方案 中 ， 碎 片 化 仍然 是 个 不 可 克服 的 问题 ， 不 过 在 这 个 看 上 去 很 简单 
的 方案 里 还 有 其 他 东西 值得 考虑 。 释 放 某 人 ? 运行 时 系统 需要 用 某 种 方式 
ee 配 。 它 是 通过 维护 空 空闲 空间 的 链表 一 一 来 达成 这 点 的 。 稍 作 

就 会 想到 问题 ， 空 闲 表 存 在 哪 ， 4 商 和 让 二 省 于 ， 业 过 是 空闲 表 存 放 在 空闲 的 
内 用 池 元 禄 册 ， 这 就 意味 着 内 存 分 配 时 存在 最 小 分 配 单元 。 





那么 ， 原 则 上 ， 每 次 malloc 现在 必须 遍历 空闲 表 以 找到 合适 的 位 置 。 说 “合适 "是 因为 分 配 者 
必须 做 出 复杂 的 决定 。 遇 到 第 一 个 匹配 的 空间 就 分 配 呢 还 是 继续 找 找 ? 而 且 " 匹 配 ? 又 是 怎么 定 
义 的 呢 ? 应 该 选取 那些 大 小 刚好 的 空间 ， 还 是 将 大 些 的 空间 拆 分 成 小 块 〈 从 而 增加 创建 不 可 
用 的 小 空间 的 可 能 性 ) ?还 有 其 它 诸多 问题 。 


程序 员 布 训 内 存 分 配 高 效 。【 注 释 1】 因 此 ， 实 践 中 ， 分 配 系统 倾向 于 只 使 用 一 组 固定 的 尺 
寸 ， 通 常 是 2 的 圭 。 这 样 我 们 就 可 以 不 是 只 维护 一 个 空闲 表 ， 而 是 为 每 个 尺寸 (都 是 2 的 办) 
维护 一 个 空闲 表 。 然 后 再 维护 一 个 指向 这 些 表 的 数组 ， 位 操作 可 以 减 小 数组 索引 的 代价 。 当 
然 ， 这 样 会 浪费 一 些 空间 ， 因 为 当 需 要 那些 不 是 2 的 圭 尺 寸 的 内 存 时 ， 最 终 分 配给 其 的 内 存 尾 
部 将 会 有 空余 。 (这 是 计算 机 科学 中 经 典 的 取舍 (trade-off) : 空间 换 时 间 ) 。 free 需要 将 释 
放 的 内 存放 到 合适 的 链表 中 ， 有 时 候 还 需要 将 较 大 块 的 内 存 分 割 成 小 块 以 为 将 来 的 分 配 做 准 
备 。 这 个 模型 中 的 任何 部 分 都 不 像 看 上 去 的 那样 高 效 。【 注释 2】 


如 果 内 存 分 配 不 够 高 效 ， 开 发 者 会 尝试 各 种 奇 技 赢 巧 来 重用 程序 中 的 值 ， 这 会 降低 代码 
的 清晰 性 ， 很 有 可 能 会 导致 错误 。 


特别 地 ， free 并 不 免费 (译注 : 双关 ) 。 


当然 ， 所 有 这 些 都 基于 程序 员 可 以 写 出 可 靠 (忽略 完备 ) 程序 的 基础 上 。 但 是 他 们 做 不 到 。 


11.3.2 引用 计数 


由 于 完全 手工 内 存 回 收 给 程序 员 带 来 极 大 的 负担 ， 一 些 半自动 化 技术 被 广 为 使 用 ， 最 为 人 知 
的 便 是 引用 计数 (reference counting) 。 


使 用 引用 计数 的 方式 ， 每 个 值 都 关联 一 个 计数 ， 记 录 对 其 引用 的 个 数 。 程 序 员 负责 负责 递增 
和 递减 这 些 计 数 。 当 计数 降 为 0 时 ， 该 值 的 空间 可 以 安全 的 回收 供 未 来 使 用 。 


请 注意 ， 上 面 简单 的 定义 中 隐藏 了 两 个 重要 假设 : 
1， 程序 员 可 以 记录 每 一 次 引用 。 回 忆 一 下 ， 别 名 也 是 引用 。 因 此 ， 当 写 出 下 面 的 代码 时 ， 


(let ([x <some value>]) 
we X] ) 


程序 员 需 要 记 住 y 是 对 x 引用 的 那个 值 的 第 二 次 引用 ， 因 此 要 增加 该 值 的 引用 计数 。 
2. 每 个 值 只 有 有 限 个 引用 。 如 果 数 据 中 存在 环 路 ， 这 条 假设 不 成 立 。 


由 于 需要 手动 递增 和 递减 引用 ， 这 种 技术 缺乏 可 靠 性 与 完备 性 。 事 实 上 ， 上 述 第 二 个 假设 自 
然 导 致 完 备 性 的 袁 失 ， 而 第 一 个 假设 则 指出 了 最 简单 的 方式 来 打破 可 靠 性 。 


手工 管理 内 存 的 葬 端 还 可 以 更 为 深层 隐 上 。 由 于 程序 员 负 责 释放 内 存 (或 者 ， 等 效 的 ， 管 理 
引用 计数 ) ， 内 存 管 理 策略 必须 成 为 每 个 库 接口 的 一 部 分 : 即 ，“ 库 中 分 配 的 值 谁 来 释放 ? 库 
会 否 释 放 传 递 给 它 的 值 ?" 很 不 幸 ， 用 文档 准确 记录 、 并 遵守 这 种 策略 信息 极其 困难 ， 更 糟 的 
是 ， 它 会 导致 文档 中 充斥 关于 底层 的 细节 ， 它 们 通常 与 库 要 封装 的 行为 毫 无 关系 。 


一 个 有 趣 的 想法 是 将 计数 值 的 增 减 自动 化 。 另 一 个 想法 是 在 实现 中 添加 循环 检测 〈cycle- 
detection) 。 引 入 这 两 者 将 解决 上 述 的 很 多 问题 ， 但 是 引用 计数 还 有 一 些 其 它 问题 : 


e 引用 计数 会 增加 每 个 对 象 的 大 小 。 计 数 器 需要 足够 大 以 防止 溢出 ， 又 要 足够 小 以 避免 过 
多 的 内 存 占用 。 

e。 对 这 些 计数 器 值 的 增 减 花费 的 时 间 会 相当 可 观 。 

e。 如 果 一 个 对 象 的 引用 计数 降 至 0， 那 么 它 所 引用 的 所 有 内 容 的 计数 值 都 需要 减 一 ， 这 种 行 
为 可 能 会 是 递归 的 。 这 意味 着 一 次 释放 操作 可 能 会 花费 大 量 时 间 ， 除 非 使 用 聪明 的 “ 情 性 
(lazy) "技巧 (这样 的 话 又 会 导致 内 存 占 用 增加 ) 。 

e@ 为 了 减少 计数 值 ， 我 们 需要 遍历 已 经 是 垃圾 的 对 象 。 这 看 上 去 很 违反 直觉 : 遍历 我 们 已 
经 不 感 兴趣 的 对 象 。 工 程 实践 中 这 会 产生 后 果 : 这 些 我 们 不 感 兴趣 的 对 象 有 可 能 已 经 很 
久 没 有 被 访问 过 了 ， 这 意味 着 它们 可 能 被 换 页 换 出 内 存 了 。 引 用 计数 器 需要 将 它们 换 页 


回 内 存 ， 仅 为 了 告诉 它们 它们 不 再 被 需要 了 。 
出 于 所 有 这 些 原因 ， 应 说 懂 引 用 计数 。 你 不 应 接受 它 作 为 默认 ， 而 是 应 该 问 自己 ， 为 什么 拒 
绝 通 常 被 认为 更 好 的 自动 化 技术 。 
练习 


如 果 引 用 计数 溢出 了 ， 哪 些 正确 性 属性 被 破坏 ， 是 怎么 被 破坏 的 ? 权衡 利 准 。 


11.4 自动 回收 ， 或 垃圾 收集 


有 些 人 认为 引用 计数 是 “垃圾 收集 "技术 的 一 种 。 我 更 喜欢 用 后 一 个 术语 来 指 完 全 自动 的 技 


术 。 但 是 浏览 网 页 时 请 注意 可 能 的 混淆 。 


现在 让 我 们 来 简要 地 考察 一 下 让 语言 的 运行 时 系统 自动 化 回收 垃圾 的 过 程 。 我 们 将 使 用 缩写 
GC (Garbage Collection ) 同时 指 代 垃 圾 回收 的 算法 与 垃圾 回收 的 过 程 ， 上 下 文 可 以 帮 你 区 
分 具体 指 代 哪 个 。 


11.4.1 概览 


所 有 GC 算法 的 核心 是 通过 值 间 引用 关系 遍历 内 存 。 人 遍历 从 根 集 (root set) 开始 ， 也 就 是 是 程 
序 可 能 引用 贮存 中 值 的 所 有 地 方 。 通 常 ， 根 集 由 环境 中 的 绑 定 变量 以 及 全 局 变量 组 成 。 在 实 
际 实现 中 ， 还 需要 考虑 到 类 似 寄 存 器 中 的 引用 这 种 易 逝 值 。 从 根 集 开始 ， 算 法 使 用 一 系列 算 
法 一 一 通常 是 深度 优先 搜索 【 注释 】 的 变 体 一 一 来 遍历 所 有 可 访问 的 值 ， 以 识别 所 有 存活 的 
值 ( 即 ， 通 过 一 些 程序 操作 的 序列 可 用 到 的 值 ) 。 按 定义 所 有 其 它 数 据 就 是 垃圾 。 不 同 的 算 
法 使 用 不 同 的 方式 回收 这 些 空间 。 





通常 选用 深度 优先 搜索 ， 因 为 它 适用 于 基于 堆栈 的 实现 。 当 然 ， 你 可 能 (也 应 该 ) 想 知 
道 GC 自 己 的 栈 存储 在 哪里 ! 


11.4.2 事实 和 可 证 性 


如 果 你 仔细 阅读 的 话 ， 你 会 发 现 上 面 我 描述 了 一 个 算法 。 这 是 实现 的 细节 ， 而 不 是 规范 的 一 
部 分 ! 垃圾 回收 的 规范 是 事实 (truth) 的 表述 : 我 们 要 准确 地 回收 所 有 是 垃圾 的 值 ， 不 多 也 
不 少 。 但 是 对 于 任何 图 灵 完 备 的 编程 语言 ， 我 们 都 没 法 得 出 这 一 事实 ， 于 是 我 们 退 而 求 其 
次 ， 了 寻求 可 证 性 〈provability) 。 上 述 的 算法 描述 提供 了 存活 性 的 有 效 “ 证 明 ”， 其 补 集 就 是 垃 
圾 。 这 个 方案 当然 还 有 变种 ， 收 集 更 多 或 更 少 的 垃圾 ， 取 决 于 证 明 " 垃 圾 性 ?的 不 同 强度 。 


上 面 的 说 的 最 后 一 点 指出 了 严格 规范 术语 描述 中 的 缺陷 ， 对 于 要 回收 多 少 垃圾 它 完 全 没有 说 
明 。 考 虑 一 下 极端 情况 实际 上 是 有 益 的 。 


思考 是 


定义 一 个 可 靠 的 垃圾 回收 策略 很 简单 。 同 样 ， 定 义 一 个 完备 的 的 垃圾 回收 策略 也 非常 简 
单 。 你 能 想到 怎么 做 吗 ? 
要 做 到 可 每， 我 们 只 要 确保 不 会 错误 的 移 除 任何 可 能 存活 的 数据 。 一 种 确保 无 疑 的 方式 就 是 
完全 不 回收 垃圾 。 与 之 对 应 ， 完 备 的 GC 回收 所 有 东西 。 显 然 这 两 者 都 是 无 用 的 (后 者 显然 极 
其 危险 ) 。 这 为 我 们 的 工程 实践 指明 了 一 点 ， 我 们 不 仅 需 要 GC 是 可 靠 的 ， 也 希望 它 足够 完 
备 ， 同 时 还 要 足够 高 效 。 


11.4.3 核心 假设 


一 一 


能 够 可 靠 地 执行 GC 依 赖 于 两 条 关键 的 假设 。 一 条 有 关 语 言 的 实现 ， 另 一 条 有 关 语 言 的 语义 。 


1， 对 语言 中 的 值 ，GC 需 要 知道 该 值 的 类 型 以 及 它 在 内 存 中 的 表示 法 。 例 如 ， 当 遍历 
到 cons 单元 ， 它 必须 知道 : 
i， 这 是 一 个 cons 单元 ; 因此 ， 
first 在 哪里 ， 例 如 位 于 4 个 字 节 的 偏 移 量 的 地 方 ， 
rest 在 哪里 ， 例 如 位 于 8 个 字 节 的 偏 移 量 的 地 方 。 
显然 ， 这 个 属性 必须 递归 地 保持 ， 使 得 遍历 莫 法 能 够 正确 映射 内 存 中 的 值 。 


2， 程序 不 能 通过 下 面 两 种 方式 生成 引用 : 


i 对象 引 用 不 能 发 生 在 语言 实现 预先 定义 的 根 集 之 外 。 

ii， 对 象 引 用 只 能 指向 对 象 中 明确 定义 的 点 。 
违反 第 二 条 时 ，GC 将 完全 乱 套 ， 错 误 的 解释 数据 。 第 一 条 看 上 去 显而易见 ， 如 果 它 被 违 
反 ， 意 味 着 运行 时 系统 错误 地 理解 语言 的 语义 。 然 而 这 条 的 后 果 有 点 微妙 ， 下 面 将 会 讨 


论 。 


11.5 保守 垃圾 回收 


上 文 说 过 ， 一 般 根 集 包含 环境 、 全 局 变量 和 一 些 易 逝 值 。 引 用 还 可 能 出 现在 什么 地 方 ? 


在 大 部 分 语言 中 ， 没 有 其 他 地 方 了 。 但 是 有 些 语言 【说 的 就 是 你 们 ，C 和 C++) 允许 将 引用 转 
换 成 数 ， 以 及 将 任意 数 转 换 成 引用 。 因 此 ， 原 则 上 ， 程 序 中 的 任何 数值 (由 于 C 和 C++ 类 型 系 
统 的 特性 ， 程 序 中 几乎 任何 值 ) 都 可 以 被 视 为 引用 。 


两 个 原因 使 得 它 问题 重重 。 首 先 ，GC 不 能 只 将 其 注意 力 集中 到 一 个 较 小 的 根 集 ; 现在 整个 贮 
存 都 是 潜在 的 根 集 。 其 次 ， 如 果 GC 试 图 以 任何 方式 修改 某 个 对 象 一 一 例如 在 遍历 时 记录 一 
个 “访问 "位 一 一 这 时 它 可 能 修改 了 一 个 非 引 用 值 : 例如 ， 它 可 能 实际 上 改变 了 程序 中 某 个 (看 
似 无 关 的 ) 数 型 常量 。 因 此 ， 像 C 和 C++ 这 样 的 语言 中 的 特征 组 合 起 来 ， 使 得 合理 而 有 效 的 
GC 非常 困难 。 


但 并 不 是 不 可 能 。 一 个 令 人 兴奋 的 研究 方向 称 为 保守 GC 成 功 的 为 此 类 语言 创造 了 足 
够 高 效 的 GC 系统 。 保 守 (conservative) GC 背后 的 基本 原则 是 ， 尽 管理 论 上 每 个 贮存 地 址 都 
可 能 属于 根 集 ， 但 实际 上 它们 大 部 分 都 不 是 。 它 会 通过 一 系列 聪明 的 观察 来 推断 出 哪些 位 置 
肯定 不 是 引用 (这 点 和 传统 GC 相反 ) ， 然 后 将 它们 安全 地 忽略 掉 : 例如 ， 在 字 节 对 齐 的 体系 
架构 中 ， 奇 数值 不 可 能 为 引用 。 通 过 忽略 大 部 分 贮存 ， 通 过 对 程序 行为 作出 一 些 基本 的 假定 
(例如 程序 不 可 能 产生 某 种 类 型 的 引用 ) ， 并 且 小 心 操作 不 去 修改 贮存 (例如 ， 不 改变 值 中 
的 比特 ， 不 移动 数据 ) 的 情况 下 ， 可 以 得 到 一 个 还 算 有 效 的 GC 策略 。 








保守 GC 在 那些 使 用 或 者 依赖 C 和 C++ 实现 的 编程 语言 中 比较 常见 。 例 如 ， 早 期 的 Racket 就 完 
全 依靠 它 。 这 是 基于 以 下 原因 : 


1.， 它 是 种 便捷 的 自 举 技术 ， 语 言 实现 者 能 得 以 将 精力 集中 在 其 它 更 富 革 新 性 的 特性 上 。 

2， 如 果 语 言 能 控制 所 有 的 引用 (比如 Racket) ， 那 么 可 以 使 用 便于 提高 GC 效 率 的 内 存 表 示 
法 (例如 ， 用 1 坊 充 所 有 ( 监 正 的 ) 数 的 最 低 有 效 位 ) 。 

3， 它 使 得 该 语言 和 C 以 及 C++ 实 现 的 库 交互 变 得 容易 ( 当然 前 提 是 这 些 库 也 符合 该 技术 的 要 


求 ) 。 


这 里 需要 解释 一 下 名 词 。 如 前 所 述 ， 所 有 实用 的 GC 技 术 都 是 “保守 的 ”， 也 就 是 说 它们 用 ( 洪 
在 的 ) 可 访问 性 代替 真实 中 的 是 否 访 问 。 然 而 ，" 保 守 " 这 个 词 已 经 成 为 专门 的 术语 ， 指 在 不 合 
作 (但 不 是 故意 对 抗 ) 的 运行 时 系统 中 工作 的 GC 技术 。 


11.6 精确 垃圾 回收 


在 传统 的 GC 术语 中 ，“ 保 守 ” 的 反义词 是 精确 (precise) 。 这 也 是 误 称 ， 因 为 GC 不 可 是 精确 
的 ， 即 同时 做 到 可 靠 和 完备 。 这 里 精确 更 多 是 对 识别 引用 能 力 的 表述 : 当面 对 值 时 ， 精 确 GC 
知道 什么 是 和 不 是 引用 ， 以 及 引用 的 位 置 在 哪 。 相 对 保守 GC， 这 省 去 了 猜测 哪些 值 不 是 引用 
(并 以 此 尽 可 能 多 地 消除 潜在 引用 ) 这 项 繁重 的 工作 。 


大 多 数 当 代 语 言 的 运行 时 系统 使 用 精确 GC， 而 精确 GC 领域 中 存在 大 量 的 实现 技术 。 我 推荐 
Paul Wilson 的 调查 报告 (虽然 这 份 材料 有 点 显 老 ， 但 在 这 个 快速 发 展 的 领域 中 仍 是 很 好 的 资 
源 ) 和 Richard Jones 的 书 和 和 资料。 最后， 对 于 世代 垃圾 收集 器 的 概述 ， 可 以 读 一 下 简单 的 世 
代 垃圾 收集 器 和 快速 分 配 。 


12 表示 层 抉 择 


回去 看 看 我 们 将 函数 作为 值 的 那个 解释 器 ， 你 能 找到 其 中 不 一 致 的 地 方 吗 ? 
思考 题 
找到 了 吗 ? 


考虑 一 下 我 们 是 怎么 表示 这 两 种 值 的 : 数 和 函数 。 忽 略 其 外 面 numv 和 closv 这 一 层 ， 注 意 它 
们 底层 的 数据 表示 。 我 们 使 用 Racket 中 的 数 来 表示 要 解释 的 语言 中 的 数 ， 但 是 我 们 没有 使 用 
Racket 中 的 函数 ( 闭 包 ) 来 表示 要 解释 的 语言 中 的 函数 ( 闭 包 ) 。 

这 就 是 不 一 致 的 地 方 。 更 一 致 的 做 法 是 ， 要 么 都 用 Racket 中 的 值 表示 ， 要 么 都 不 用 。 那 么 我 
们 为 什么 要 做 出 这 种 决定 呢 ? 


这 么 做 是 要 说 明 一 个 问题 。 本 章 我 们 就 讨论 此 问题 。 


12.1 改变 表示 


我 们 暂且 探究 一 下 数 。Racket 中 数 很 强大 所 以 我 们 重用 它 : 它 支持 任意 大 小 的 整数 
(bignum ) 、 有 理 数 (这 点 受益 于 整数 的 bignum 表 示 ) 、 复 数 等 等 。 因 此 ， 它 能 表示 出 大 部 
常规 语言 中 的 数 系统 。 然 而 ， 这 并 不 意味 着 它 就 是 我 们 想 要 的 : 它 可 能 过 于 简单 或 者 过 于 


杂 : 


心 > 


ba 


。 如 果 我 们 需要 的 是 某 种 受 限 的 数 系统 ， 它 就 过 于 复杂 了 。 例 如 Java 中 规定 了 一 组 定 长 的 
数 的 表示 (如 : int 被 指定 为 32 位 的 ) 。 超 出 这 个 规定 范围 的 数 在 Java 中 将 不 能 直接 被 表 
示 ， 同 时 算术 运算 也 遵循 此 范围 (例如 : 由 于 溢出 ，1 加 2147483647 将 不 能 得 到 
2147483648) 。 

。 如 果 我 们 需要 更 为 丰富 的 数 系统 ， 它 又 会 捉襟见肘 ， 比 如 包含 四 元 数 或 者 和 概率 相关 的 
数 。 


粮 糕 的 是 ， 我 们 根本 没有 想 过 自己 的 需求 ， 就 直接 轻率 的 使 用 Racket 中 的 数 作 为 我 们 语言 中 
数 的 表示 。 


之 所 以 这 样 做 ， 是 因为 我 们 并 不 关心 数 本 身 ; 我 们 关心 的 是 诸如 将 函数 作为 值 这 样 的 编程 语 
言 特性 。 然 而 ， 作 为 语言 设计 者 ， 你 应 当 在 最 开始 的 时 候 就 考虑 到 这 些 问题 。 


接 下 来 讨论 闭 包 的 表示 。 我 们 其 实 可 以 利用 Racket 的 闭 包 来 表示 目标 语言 中 的 对 应 概念 ， 与 
之 对 应 的 ， 用 Racket 中 最 基本 的 函数 调用 来 实现 目标 语言 中 的 函数 调用 。 


思考 题 


使 用 Racket 骂 数 蔡 换 之 前 闭 包 的 实现 。 


答案 在 此 : 


(define-type Value 
[numv (n : number)] 
[closv (f : (Value -> Value))]) 


(define (interp [expr : ExprC] [env : Env]) : Value 
(type-case ExprC expr 
[numC (Nn) (numv n)] 
[idc (n) (lookup n env)] 
[appCc (f a) (local ([define f-value (interp f env)] 
[define a-value (interp a env)]) 
((closV-f f-value) a-value))] 
[plusC (1 r) (num+ (interp 1 env) (interp r env))] 
[multC (1 r) (num* (interp 1 env) (interp r env))] 
[lamC (a b) (closv (lambda (arg-val) 
(interp b 
(extend-env (bind a arg-val) 


env))))])) 


练习 


注意 到 一 个 有 趣 的 变化 。 之 前 的 实现 中 ， 环 境 是 在 解释 appC 时 被 扩展 的 。 这 里 它 是 在 
lamC 的 解释 过 程 中 被 扩展 的 。 是 这 两 个 中 有 一 个 出 错 了 吗 ? 如 果 不 是 的 话 ， 为 什么 会 出 
现 这 种 情况 ? 


这 种 实现 方式 显然 更 为 简洁 ， 但 是 我 们 失去 了 一 项 重要 的 东西 : 理解 。 告 诉 别 人 源 语言 中 的 
部 数 对 应 于 lambda 等 于 什么 都 没 说 : 如 果 我 们 已 经 知道 lambda 是 干 嘛 的 我 们 可 能 就 不 会 花 时 
间 去 研究 它 ; 如 果 不 知道 的 话 ， 这 种 直接 映射 的 实现 方式 也 不 会 教 给 我 们 哈 (而 且 很 可 能 会 
让 本 来 就 对 该 概念 一 无 所 知 的 我 们 更 加 困惑 ) 。 出 于 同样 的 理由 ， 我 们 没有 使 用 Racket 中 的 
状态 去 理解 各 种 对 状态 的 操作 。 


然而 ， 一 旦 我 们 理解 了 某 个 特性 ， 使 用 它 来 表示 将 不 再 是 问题 。 实 际 上 ， 这 样 做 会 使 得 我 们 
的 解释 器 更 为 简洁 ， 毕 竟 我 们 不 再 手工 实现 所 有 事情 。 事 实 上 ， 如 果 不 使 用 这 种 表示 方式 ， 
后 面 的 一 些 解 释 器 会 变 得 毫 无 可 读 性 。【 注 释 】 尽 管 如 此 ， 我 们 还 是 应 该 注意 防范 过 度 使 用 
宿主 语言 的 特性 可 能 招致 的 风险 。 


有 点 像 是 ,现在 我 们 已 经 能 够 通过 加 一 来 理解 加 法 ， 我 们 可 以 用 加 法 来 定义 乘法 : 不 再 
需要 使 用 加 一 来 定义 来 法 。” 


12.2 错误 


当 程 序 出 错时 ， 程 序 员 需要 得 到 相应 的 错误 信息 。 直 接 使 用 宿主 语言 特性 可 能 导致 用 户 收 到 
宿主 语言 中 抛 出 的 错误 ， 这 些 错误 将 无 法 被 理解 。 因 此 ， 我 们 需要 说 懂 的 将 各 种 情况 的 错误 
翻译 成 我 们 语言 的 用 户 所 能 理解 的 术语 ， 且 不 让 宿主 语言 中 的 错误 信息 “泄漏 过 来 "。 

更 糟糕 的 情形 是 ， 那 些 本 应 出 错 的 程序 可 能 不 会 报错 1 例如， 假设 我 们 设计 时 决定 让 罚 数 只 
出 现在 顶层 位 置 ， 如 果 我 们 没有 特意 地 检测 这 点 ， 其 被 去 语法 糖 后 得 到 lambda， 有 最 后 可 能 在 
解释 器 中 被 解释 得 到 结果 ， 而 它 本 来 应 该 使 解释 器 出 错 停止 。 因 此 ， 我 们 应 该 极其 注意 ， 仅 


允许 符合 期 望 的 表层 语言 被 映射 到 宿主 语言 中 。 


再 举 个 例子 ， 考 虑 不 同 的 赋值 操作 。 在 我 们 的 语言 中 ， 给 未 绑 定 的 变量 赋值 会 导致 错误 。 但 
是 在 有 些 语 言 中 ， 这 种 操作 会 导致 该 变量 被 定义 。 语 言 设 计 者 常 犯 的 错误 是 没有 很 好 的 确定 
想 要 的 语义 ， 然 后 推脱 说 “ 它 就 是 实现 出 来 的 那个 样子 "。 这 种 态度 (a) 是 懒惰 、 马 虎 的 ， 
(b) 可 能 招致 不 可 预料 、 负 面 的 后 果 ， (Cc) 它 使 得 将 语言 从 一 个 实现 平台 移 到 另 一 个 实现 
平台 变 得 困难 。 不 要 犯 这 个 错误 ! 


12.3 改变 含义 


将 作为 值 的 函数 映射 为 lambda 之 所 以 可 行 是 因为 我 们 本 来 就 希望 它们 拥有 相同 的 含义 。 但 是 
这 种 实现 方式 使 得 改变 函数 的 含义 变 得 极为 困难 。 让 我 给 你 设想 一 个 情形 : 假设 我 们 想 要 实 
现 动 态 作 用 域 。 【注释 】 在 我 们 原来 的 解释 器 中 ， 这 很 简单 (历史 告诉 我 们 ， 简 直 太 简单 
了 ) 。 试 着 在 使 用 了 lambda 的 解释 器 中 实现 动态 作用 域 。 同 样 的 ， 将 及 早 求 值 (eager 
evaluation) 特性 映射 到 惰性 求 值 (lazy application ) 的 语言 中 (译注 ， 第 17 章 ) 也 是 担 有 难 
度 的 ， 或 者 说 至 少 不 太 容 易 。 

只 是 假设 而 已 。 
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将 上 面 的 解释 器 改 成 动态 作用 域 的 。 
重点 是 ， 使 用 自己 构造 的 数据 结构 并 不 会 使 事情 更 为 简单 ， 但 一 般 来 说 也 不 会 使 事情 变 得 更 
为 复杂 ; 与 之 相对 ， 映 射 成 语言 本 身 特性 的 方式 会 使 某 些 特性 一 一 通常 是 宿主 语言 中 已 有 的 
特性 一 一 的 实现 极为 简单 ， 但 是 使 其 他 特性 的 实现 变 得 微妙 或 困难 。 还 有 一 个 风险 是 ， 我 们 
可 能 并 不 十 分 清楚 宿主 语言 的 某 个 特性 具体 实现 了 些 什 么 (比如 ，“lambda” 是 否 丨 的 实现 了 
静态 作用 域 ?) 。 
教训 是 ， 仅 当 我 们 想 要 “保留 "底层 语言 的 意义 时 ， 这 才 是 好 用 的 一 一 其 至 是 特别 明智 的 ， 因 为 
它 确保 我 们 不 会 意外 地 改变 其 意义 。 但 是 ， 如 果 我 们 要 利用 基础 语言 的 重要 组 成 部 分 ， 而 5 
是 扩展 它 的 含义 ， 那 么 其 他 的 实现 策略 可 能 也 不 错 (译注 ， 第 13 章 ) ， 而 不 是 编写 解释 器 。 


2 
、 


12.4 为 一 个 例子 


我 们 再 考虑 改变 一 个 特性 的 表示 方式 。 还 记得 环境 是 什么 吗 ? 


环境 是 名 字 到 值 《如果 有 赋值 的 话 ， 那 么 是 名 字 到 地 址 ) 的 映射 。 我 们 通过 自 建 的 数据 结构 
实现 了 这 种 映射 ， 但 是 我 们 可 以 通过 其 他 方式 实现 映射 吗 ? 当然 可 以 ， 使 用 函数 就 行 ! 这 
样 ， 环 境 就 变 成 了 读 入 名 字 为 参数 、 返 回 其 绑 定 值 〈 或 者 报错 ) 的 函数 : 


(define-type-alias Env (Symbol -> Value)) 


空 的 环境 是 什么 ? 对 于 任何 名 字 的 查询 都 抛 出 错误 的 函数 : 


(define (mt-env [name : Symbol]) 
(error 'lookup "name not found")) 


(原则 上 我 们 应 该 给 它 的 返回 值 添加 类 型 注解 ， 应 该 是 Value， 但 是 在 这 里 没 只 意义 ) 。 给 环 
境 添 加 新 的 绑 定 就 是 创建 新 函数 ， 该 函数 检查 该 名 字 是 不 是 正在 扩展 的 那个 绑 定 ; 如 果 是 ， 
直接 放 回 对 应 的 绑 定 值 ， 如 果 不 是 ， 往 被 扩展 的 环境 传 就 行 。 

(define (extend-env [b : Binding] [e : Env]) 
(lambda ([name : Symbol]) : Value 
(if (Symbol=? name (bind-name b)) 


(bind-val b) 
(lookup name e)))) 


最 后 ， 怎 么 再 环境 中 查询 某 个 名 称 呢 ?调用 该 环境 即 可 。 


(define (lookup [n : Symbol] [e : Env]) : Value 
(e n)) 


大 功 告 成 ! 


13 语言 中 支持 去 语法 糖 
关于 去 语法 糖 (desugaring) ， 之 前 很 多 讨论 都 谈 到 、 
制 是 薄弱 的 。 实 际 上 我 们 用 两 种 不 同 的 方式 来 使 用 去 语法 糖 。 一 方面 ， 我 们 用 它 来 缩小 语 
言 : 输入 是 一 个 大 语言 ， 去 语法 糖 后 得 到 其 核心 。 另 一 方面 ， 我 们 也 用 它 来 扩展 语言 
这 表明 ， 去 语法 糖 是 非常 有 用 的 功能 。 它 是 如 此 之 有 用 ， 我 


现 有 语言 ， 为 其 添加 新 的 功能 。 


们 该 思考 一 下 如 下 两 个 问题 : 


Rb 样子 呢 ? 请 注意 ， 
2 


@ 
本 章 我 们 将 通过 研究 Racket 提 供 的 解决 方案 同时 探索 这 两 个 问题 。 
A 
13.1 和 钊 一 个 例子 
DrRacket 有 个 非常 有 用 的 工具 叫 Ma tone ( 宏 步 进 器 ) ， 它 能 逐步 逐步 地 显示 程 
序 的 展开 。 你 应 该 对 本 章 中 的 所 有 例子 尝试 Macro Stepper。 不 过 现在 ， 你 应 该 用 #lang 
plai 而 不 是 州 ang plai-typed 来 运行 。 
忆 一 下 ， 前 文 我 们 添加 let 时 ， 是 将 其 当 作 lambda 的 语法 糖 的 。 它 的 模式 是 
(let (var val) body) 
被 转换 为 
((lambda (var) body) val) 
思考 题 
如 果 这 听 起 来 不 太 熟 入， 那么 现在 是 时 候 回忆 一 下 它 是 怎么 运作 的 了 。 
描述 这 个 转换 最 简单 的 方法 就 是 直接 把 它 写 出 来 ， 比 如 : 
(let (var val) body) 
-> 
((lambda (var) body) val) 
正 是 Racket 语 法 允许 你 做 的 
有 定义 了 。 


说 ， 扩 展 某 个 基本 语言 ， 添 加 上 一 个 问题 的 答案 所 描 


用 到 了 ， 但 是 我 们 目前 的 去 语法 糖 机 
Sa 


吾 言 : 给 定 


， 设 计 一 种 支持 去 语法 糖 的 语言 ， 它 


。 我 们 创建 语言 的 目的 是 简化 常见 任务 的 创建 ， 那 么 
注意 ， 这 里 的 “样子 ?不 仅仅 指 语法 ， 也 包括 语言 的 行为 特性 。 
通用 语言 常常 被 用 作 去 语法 糖 的 目标 ， 那 为 什么 他 们 不 内 建 去 语法 糖 的 能 力 呢 ? 比如 


述 的 语言 豆 9 


事实 上 ， 这 差不多 正 是 
分 名 为 my-let 而 不 是 let ， 因 为 后 者 在 Racket 中 已 经 有 定义 


我 们 将 其 命 


(define-syntax my-let-1 ;定义 语法 
(syntax-rules () ;语法 规则 
[(my-let-1 (var val) body) 

((lambda (var) body) val)])) 


syntax-rules 告诉 Racket， 只 要 看 到 的 某 个 表达 式 在 左 括号 之 后 跟 的 是 my-let-1 ， 就 应 该 检 
查 它 是 否 遵循 模式 (my-let-1 (var val) body) 。 这 里 var ， val 和 body 是 语 ; 量 : 它们 
是 代表 代码 的 变量 ， 可 以 匹配 该 位 置 的 任意 表达 式 。 如 果 表 达 式 和 模式 匹配 ， en 变量 
就 绑 定 为 对 应 的 表达 式 ， 并 且 在 右边 〈 的 表达 式 中 ) 可 用 。 


您 可 能 已 经 注意 到 一 些 额 外 的 语法 ， 如 () 。 我 们 稍 后 再 解释 





右边 (的 表达 式 ) 一 一 在 这 里 是 ((lambda (var) body) val) a 的 输出 。 每 个 语法 
变量 都 被 替换 (注意 我 们 的 老 有 朋友， 替换 ) 其 对 应 的 输入 部 分 。 这 个 替换 过 程 非常 简单 ， 不 


会 做 过 多 的 处 理 。 因 此 ， 如 果 我 们 尝试 这 么 用 


(my-let-1 (3 4) 5) 


第 一 步 Racket 不 会 抱 怒 3 出 现在 标识 符 的 位 置 ; 相反 ， 它 会 照常 处 理 ， 去 语法 糖 得 


((lambda (3) 5) 4) 


下 一 步 会 产生 错误 : 


lambda: expected either <id> or ` [<id> : <type>]' 
for function argument in: 3 


这 就 表明 ， 去 语法 糖 的 过 程 在 其 功能 en 
简单 的 蔡 换 重 写 而 已 。 其 输出 是 表达 式 ， 这 个 表达 式 也 可 以 被 进一步 去 语法 糖 。 


前 文中 提 到 过 ， 这 种 简单 的 表达 式 重 写 通常 使 用 术语 宏 (macro) 称呼 。 传 统 上 ， 这 种 类 型 的 
去 语法 糖 被 称 为 宏 展 开 (macro expansion) ， 不 过 这 个 术语 有 误导 性 ， 因 为 去 语法 糖 后 的 输 
出 可 以 比 输入 更 小 (通常 还 是 更 大 啦 ) 。 


当然 ， 在 Racket 中 ， let 可 以 绑 定 多 个 标识 符 ， 而 不 仅仅 是 一 个 。 非 正式 的 写 下 这 种 语法 的 
首 述 的 话 ， 比 如 在 黑板 上 ， 我 们 可 能 会 这 样 

写 ， (let ([var val] ...) body) -> ((lambda (var ...) body) val ...) ， 其 中 ... 表示 “ 零 或 

更 多 个 ”， 。 ， 输出 中 的 var ... 要 对 应 输入 中 的 多 个 var 。 同 样 ， 描 述 它 的 Racekt 语 

法 长 的 差不多 就 是 这 样 : 


(define-syntax my-let-2 
(syntax-rules () 
[(my-let-2 ([var val] ...) body) 
((lambda (var ...) body) val ...)])) 


请 注意 ... 符号 的 能 力 : 输入 中 “对 ”的 序列 在 输出 中 变 成 序列 对 了 ; 换 句 话说 ，Racket 将 输 
入 序列 " 解 开 ” 了 。 与 之 相对 ， 同 样 的 符号 也 可 以 用 来 组 合 序 列 。 


13.2 用 函数 实现 语法 变换 器 


之 前 我 们 看 到 ，my-let-1 并 不 会 试图 确保 标识 符 位 置 中 的 语法 是 站 正 的 ( 即 语法 上 的 ) 标识 
符 。 用 syntax-rules 机 制 我 们 没 法 弥补 这 一 点 ， 不 过 使 用 更 强大 的 机 制 ， 称 为 syntax-case， 就 
可 以 做 到 。 由 于 syntax-case 还 有 很 多 其 他 有 用 的 功能 ， 我 们 分 步 来 介绍 它 。 


首先 要 理解 的 是 ， 宏 实际 上 是 一 种 函数 。 但 是 ， 它 并 不 是 从 常见 的 运行 时 值 到 (其 他 ) 运行 
时 值 的 函数 ， 而 是 从 语法 到 语法 的 函数 。 这 种 函数 执行 的 目的 是 创建 要 被 执行 的 程序 。 注 意 
这 里 我 们 说 的 是 要 被 执行 的 程序 : 程序 的 实际 执行 可 能 会 晚 得 多 (甚至 根本 不 执行 ) 。 看 看 
去 语法 糖 的 过 程 ， 这 点 就 很 清楚 了 ， 很 显然 它 是 (一 种 ) 语法 到 ( 另 一 种 ) 语法 的 函数 。 两 
个 方面 可 能 导致 混淆 : 


©® syntax-rules 的 表示 中 并 没有 明确 的 参数 名 或 者 函数 头 部 > 可 能 没有 明确 表明 这 是 一 个 
转换 函数 (不 过 重 写 规则 的 格式 有 了 暗示 这 个 事实 ) 。 

。 去 语法 糖 指 的 是 ， 有 个 (完整 的 ) 函数 完成 了 整个 过 程 。 这 里 ， 我 们 实际 写 的 是 一 系列 
小 函数 ， 每 个 函数 处 理 一 种 新 的 语法 结构 (比如 my-let-1) ， 这 些小 函数 被 某 个 看 不 见 的 
函数 组 合 起 来 ， 完 成 整个 重 写 过 程 。 (比如 说 ， 我 们 并 没有 说 明 ， 基 个 宏 展开 后 的 输出 





是 否 还 会 进一步 被 展开 不 过 简单 试 一 下 就 知道 ， 事 实 确 实 如 此 。) 
练习 
编写 一 个 或 多 个 宏 ， 以 确定 宏 的 输出 会 被 进一步 展开 。 


还 有 个 微妙 之 处 。 宏 的 外 观 和 Racket 代 码 非 常 类 似 ， 并 没有 指明 它 “ 生 活 在 另 一 个 世界 ”。 想 象 
宏 定义 使 用 的 是 完全 不 同 的 语言 一 一 这 种 语言 只 处 理 语法 一 一 写 就 很 有 助 于 我 们 建立 抽象 。 
然而 ， 这 种 简化 并 不 成 立 。 现 实 中 ， 程 序 变换 器 器 (compiler) 一 一 也 是 完 
整 的 程序 ， 它 们 也 需要 普通 程序 所 需要 的 全 部 功能 。 也 就 是 说 我 们 还 需要 创立 一 种 平行 语 

言 ， 专 门 处 理 程序 。 这 是 浪费 和 毫 无 意义 的 ; 因此 ，Racket 自 身 就 支持 语法 转换 所 需 的 全 部 
功能 。 











背景 说 完了 ， 接 下 来 开始 介绍 syntax-case 。 首 先 我 们 用 它 重 写 my-let-1 ( 重 写 时 使 用 名 字 
my-let-3) 。 第 一 步 还 是 先 写 定义 的 头 部 ; 注意 到 参数 被 明确 写 出 


<sc-macro-eg> ::= ;Syntax-case 宏 ， 示 例 


(define-syntax (my-let-3 x) 
<sc-macro-eg-body>) 


x 被 绑 定 到 整个 (my-let-3 ...) 表达 式 


你 可 能 想到 了 ， define-syntax 只 是 告诉 Racket 你 要 定义 新 的 宏 。 它 不 会 指定 你 想 要 实现 的 方 
式 ， 你 可 以 自由 地 使 用 任何 方便 的 机 制 。 之 前 我 们 用 了 syntax-rules ; 现在 我 们 要 
用 syntax-case 。 对 于 syntax-case ， 它 需要 显 式 的 被 告知 要 进行 模式 匹配 的 表达 式 : 


<sc-macro-eg-body> ::= 
(syntax-case x () 


<sc-macro-eg-rule>) 


现在 可 以 写 我 们 想 要 表达 的 重 写 规则 了 。 之 前 的 重 写 规则 有 两 个 部 分 : 输入 结构 和 对 应 的 输 
出 。 这 里 也 一 样 。 前 者 (输入 匹配 ) 和 以 前 一 样 ， 但 后 者 (输出 ) 略 有 不 同 : 


<sc-macro-eg-rule> 人 


[(my-let-3 (var val) body) 
#'((lambda (var) body) val)] 


关键 是 多 出 了 几 个 字符 : # 。 让 我 们 来 看 看 这 是 什么 。 


在 syntax-rules 中 ， 输 出 部 分 就 指定 输出 的 结构 。 与 之 不 同 ， syntax-case 揭示 了 转换 过 程 
函数 的 本 质 ， 因 此 其 输出 部 分 实际 上 是 任意 表达 式 ， 该 表达 式 可 以 执行 任何 它 想 要 进行 的 计 
算 。 该 表达 式 的 求 值 结果 应 该 是 语法 。 


语法 其 实 是 个 数据 类 型 。 和 其 他 数据 类 型 一 样 ， 它 有 自己 的 构造 规则 。 具 体 来 说 ， 我们 通过 
写 # 来 构造 语法 值 ; 之 后 的 那个 s-expression 被 当 作 语法 值 。 (顺便 提 一 句 ， 上 面 宏 定义 中 
的 x 绑 定 的 也 是 这 种 数据 类 型 。) 


语法 构造 器 #' 有 种 特殊 属性 。 在 宏 的 输出 部 分 中 ， 所 有 输入 中 出 现 的 语法 变量 都 被 自动 绑 定 
并 替换 。 因 此 ， 比 方 说 ， 当 展开 函数 在 输出 中 遇 到 var 时 ， 它 会 将 var 替 换 为 相应 的 输入 表达 
式 。 


思考 题 
在 上 述 宏 定义 中 去 掉 #' 斌 试看。 后果 如 何 ? 


到 目前 为 止 ，syntax-case 似 乎 只 是 更 为 复杂 的 syntax-rules : 唯一 稍微 好 些 的 地 方 是 ， 它 更 清 
楚 地 描述 了 展开 过 程 的 函数 本 质 ， 同 时 明确 了 输出 的 类 型 ， 但 其 他 方面 则 更 加 策 揣 。 但 是 ， 
我 们 将 会 看 到 ， 它 还 提供 了 强大 的 功能 。 


练习 


事实 上 ，syntax-rules 可 以 被 表述 为 基于 syntax-case 的 宏 。 请 定义 这 个 宏 。 


13.3 防护 装置 


现在 我 们 可 以 回 过 来 考虑 到 最 初 引致 syntax-case 的 问题 : 确保 my-let-3 的 绑 定 位 置 在 语法 上 
是 标识 符 。 为 此 ， 您 需要 知道 syntax-case 的 一 个 新 特性 : 每 一 条 重 写 规则 可 以 包含 两 个 部 分 
(如 同 前 面 的 例子 ) ， 也 可 以 包含 三 个 部 分 。 如 果 有 三 个 部 分 ， 中 间 那 个 被 视 为 防护 装置 
(guard) : 它 是 一 个 判断 ， 仅 当 其 计算 值 为 夏 时 ， 展 开 才 会 进行 ， 否 则 就 报告 语法 错误 。 在 这 
个 例子 中 ， 有 用 的 判断 函数 是 identifier? ， 它 能 判定 某 个 语法 对 象 是 否 是 标识 符 〈 即 变 
量 ) 。 

写 出 防护 装置 ， 并 写 出 包含 防护 (装置 ) 的 ( 重 写 ) 规则 。 


希望 你 发 现 了 其 中 的 微妙 之 处 : identifier? 的 参数 是 语法 类 型 的 。 要 传 给 它 的 是 绑 定 到 var 
的 实际 语法 片段 。 回 想 一 下 ，var 是 在 语法 空间 中 绑 定 的 ， 而 #' 会 替换 其 中 的 绑 定 变量 。 因 
此 ， 这 里 防护 装置 的 正确 写法 是 : 


(identifier? #'var) 


有 了 这 些 信息 ， 我 们 现在 可 以 写 出 整个 规则 : 


<sc-macro-eg-guarded-rule> ::= 


[(my-let-3 (var val) body) 
(identifier? #'var) 
#'((lambda (var) body) val)] 


思考 是 
现在 有 了 带 防 护 的 规则 定义 ， 尝 试 使 用 宏 ， 在 绑 定 位 置 使 用 非 标 识 符 ， 看 看 会 发 生 什 
入。 


13.4 Or : 简单 但 是 包含 很 乡 特性 的 宏 


考虑 or ， 它 实现 或 操作 。 使 用 前 级 语法 的 话 ， 自 然 的 做 法 是 允许 or 有 任意 数目 的 子 项 。 我 
们 把 or 展开 为 谋 套 的 条 件 (表达 式 ) ， 以 此 判断 表达 式 的 趴 假 。 


13.4.1 第 一 次 尝试 
试 试 这 样 的 OF : 


(define-syntax (my-or-1 x) 
(syntax-case x () 
[(my-or-1 eg e1 ...) 
te (Crt (AO) 
e0 
(my-or-1 ei ...))]1)) 


下 汪 泊 们 相克 全 做 任何 数 二 的 于 十 休会 由 十 钴 匮 全民 9 顽 ) 人 下 斤 藉 王 汪 志 这 和 件 家 
达 式 ， 其 中 的 条 件 是 日 第 一 个 子 项 ; 如 果 该 项 为 种 值 ， 就 返回 这 个 值 ( 待 会 再 讨论 这 文 点 | ) 
否则 就 返回 其 余 项 的 或 。 

我 们 来 试 一 个 简单 的 例子 。 这 应 该 计算 为 盖 ， 但 是 : 


> (my-or-1 #f #t) 
my-or-1: bad syntax in: (my-or-1) 


发 生 了 什么 ?这 个 表达 式 变 成 了 


(my-or-1 #t)) 


继续 展开 


(my-or-1))) 


对 此 我 们 没有 定义 。 这 是 因为 ， 模 式 eg el ... 表示 一 个 或 更 多 子 项 ， 但 是 我 们 忽略 了 没有 
子 项 的 情况 。 


没有 子 项 时 应 该 怎么 办 ?或 运算 的 单位 元 是 假 值 。 
练习 
为 什么 正确 的 默认 值 是 #f ? 


我 们 可 以 通过 加 上 这 条 规则 ， 展 示 不 止 一 条 规则 的 宏 。 宏 的 规则 是 顺序 匹配 的 ， 所 以 我 们 必 
a 文 个 例子 中 ， 两 条 规 
则 并 不 重 且 ) 。 改 进 后 的 宏 


(define-syntax (my-or-2 x) 
(syntax-case x () 
[(my-or-2) 
#'#f] 
[(my-or-2 eg e1 ...) 
HbEeg 
eg0 
(my-or-2 ei .,.))])) 


现在 宏 可 以 和 预期 一 样 展开 了 。 虽 然 没 有 必要 ， 但 是 我 们 加 上 一 条 规则 ， 处 理 只 有 一 个 子 项 
的 情况 : 


(define-syntax (my-or-3 x) 
(syntax-case x () 
[(my-or-3) 
#'#f] 
[(my-or-3 e) 
#'e] 
[(my-or-3 e0 e1 ...) 
#'(if eg0 
e0 
(my-or-3 ei .,.))])) 


这 使 展开 的 输出 更 加 简约 ， 对 后 文中 我 们 的 讨论 是 有 帮助 的 。 


注意 到 在 这 个 版 本 的 宏 中 ， 规 则 不 再 是 互 不 重 党 的 


了 : 第 三 条 规则 (一 个 或 多 个 子 项 ) 
包含 了 第 二 条 (一 个 子 项 ) 。 因 此 ， 第 二 条 规则 与 第 三 条 


不 能 互 换 ， 这 是 至 关 重 要 的 。 


13.4.2 防护 装置 的 来 值 
之 前 说 这 个 宏 的 展开 符合 我 们 的 预期 ， 是 吧 ? 试 试 这 个 例子 : 


(let ([init #f]) 
(my-or-3 (begin (set! init (not init)) 
init) 
#f )) 


i 


请 注意 ，oOr 返 回 的 是 第 一 个 “站 值 " 的 值 ， 以 便 程 序 员 在 进一步 的 计算 中 使 用 它 。 因 此 ， 这 个 例 
子 返 回 init 的 值 。 我 们 期 望 它 是 什么 ? 因为 我 们 已 经 翻转 了 init 的 价值 ， 自 然而 然 的 ， 我 们 期 望 
它 返 回 #t 。 但 是 计算 得 到 的 是 #f 1! 


这 里 的 问题 不 在 set! 。 比 如 说 ， 如 果 我 们 在 这 里 不 放 赋 值 ， 而 是 放 上 打印 输出 ， 那 么 
印 输出 就 会 发 生 两 次 。 


要 理解 为 何如 此 ， 我 们 必须 检查 展开 后 的 代码 : 


(let ([init #f]) 
(if (begin (set! init (not init)) 
init) 
(begin (set! init (not init)) 
init) 
#f ) ) 


啊 哈 ! 因为 我 们 把 输出 模式 写成 了 


#'(if eg 
e0 
0) 


当 我 们 第 一 次 写 下 它 时 ， 看 起 来 完全 没有 问题 ， 而 这 正 表 明了 编写 宏 (或 ， 其 他 的 程序 转换 
系统 ) 时 的 一 个 非常 重要 的 原则 : 不 要 复制 代码 ! 在 我 们 的 设 定 中 ， 语 法 变量 永远 不 应 被 重 
复 ; 如 果 你 需要 重复 某 个 语法 变量 ， 以 至 于 它 所 代表 的 代码 会 被 多 次 执行 ， 请 确保 已 经 考虑 


到 了 这 么 做 的 后 果 。 或 者 ， 如 果 只 需要 该 表达 式 的 值 ， 那 么 绑 定 一 下 ， 接 下 来 使 用 绑 定 标识 
符 的 名 字 就 好 。 示 例如 下 : 


(define-syntax (my-or-4 x) 
(syntax-case x () 
[(my-or-4) 
#'#f] 
[(my-or-4 e) 
#'e] 
[(my-or-4 eg e1 ...) 
#'(let ([v e0]) 
(if v 
V 
(my-or-4 ei .,.)))])) 


这 个 引入 乡 定 的 模式 会 导致 潜在 的 新 问题 : 你 可 能 会 对 不 必要 的 表达 式 求 值 。 事 实 上 ， 它 还 
会 导致 第 二 个 、 更 微妙 的 问题 : 即使 该 表达 式 需要 被 求 值 ， 你 可 能 在 错误 的 上 下 文中 对 其 求 
值 了 ! 因此 ， 你 必须 仔细 推敲 表达 式 是 否 要 被 求 值 ， 如 果 是 的 话 ， 只 在 正确 的 地 方 求 一 次 
值 ， 然 后 存 贮 其 值 以 供 后 续 使 用 。 


用 my-or-4 重复 之 前 包含 set! 的 例子 ， 结 果 是 #t ， 符 合 我 们 的 预期 。 


考虑 这 个 宏 (let ([v #t]) (my-or-4 #f v)) 。 我 们 希望 其 计算 的 结果 是 哈 ? 显然 是 抽 : 第 一 
个 分 支 是 #f ， 但 第 二 个 分 支 是 v ，v 绑 定 到 #t 。 但 是 观察 展开 后 : 
(let ([v #t]) 
(let ([v #f]) 
(if v 


V 
v))) 


直接 运行 该 表达 式 ， 结 果 为 #f 。 但 是 ， (let ([v #t]) (my-or-4 #f v)) 求 值得 #t 。 换 种 说 
法 ， 这 个 宏 似乎 神奇 地 得 到 了 正确 的 值 : 在 宏 中 使 用 的 标识 符 名 称 似乎 与 宏 引 入 的 标识 符 无 
关 | 当 它 发 生 在 函数 中 时 ， 并 不 令 人 惊讶 ; 宏 展开 过 程 也 享有 这 种 特性 ， 它 被 称 为 卫生 
(hygiene) 。 

理解 卫生 的 一 种 方法 是 ， 它 相当 于 自动 将 所 有 绑 定 标识 符 改 名 。 也 就 是 说 ， 程 序 的 展开 如 
下 


(let ([v #t]) 
(or #f v)) 


(let ([v1 #t]) 
(or #f v1)) 


(注意 到 Vv 一 致 的 重 命名 为 v1) ， 接 下 来 变 成 


(let ([vi #t]) 
(let ([v #f]) 


V 
v1)) 
重 命名 后 变 成 


(let ([vi1 #t]) 
(let ([v2 #f]) 
V2 
v1)) 


此 时 展开 结束 。 注 意 上 述 每 一 个 程序 ， 如 果 直 接 运 行 的 话 ， 都 会 产生 正确 的 结果 。 


13.5 标识 符 捕 获 


解决 了 语法 糖 的 创造 者 常常 会 面 对 的 重要 痛 点 。 然 而 ， 在 少数 情况 下 ， 开 发 人 员 需 要 


有 
违反 卫生 原则 。 回 过 来 考虑 对 象 ， 对 于 这 个 输入 程序 : 


卫生 
故意 


(define os-1 
(object/self-1 
[first (x) (msg self 'second (+ x 1))] 
[second (x) (+ x 1)])) 


(对 应 的 ) 宏 应 该 是 什么 样 的 ? 试 试 这 样 : 


(define-syntax object/self-1 
(syntax-rules () 
[(object [mtd-name (var) vall] ...) 
(let ([self (lambda (msg-name) 
(lambda (v) (error 'object "nothing here")))]) 


(begin 
(set! self 
(lambda (msg) 
(case msg 
[(mtd-name) (lambda (var) val)] 
self))])) 


不 幸 的 是 ， 这 个 宏 会 产生 以 下 错误 : 


self: unbound identifier in module in: self 
;Self: 未 绑 定 的 标识 符 


车 误 指 向 的 是 first 方 法 体 中 的 self。 
练习 
给 出 卫生 展开 的 步骤 ， 理 解 为 何 报错 是 我 们 预期 的 结果 。 


在 正面 解决 该 问题 之 前 ， 让 我 们 考虑 输入 项 的 一 种 变 体 ， 使 绑 定 显 式 化 : 


(define os-2 
(object/self-2 self 
[first (x) (msg self 'second (+ x 1))] 
[second (x) (+ x 1)])) 


对 应 的 宏 只 需要 稍 加 修改 : 


(define-syntax object/self-2 
(syntax-rules () 
[(object self [mtd-name (var) val] ...) 
(let ([self (lambda (msg-name) 
(lambda (v) (error "object "nothing here")))]) 


(begin 
(set! self 
(lambda (msg) 
(case msg 


[(mtd-name) (lambda (var) val)] 


ee 
self))])) 


这 个 宏 展开 正确 。 
习题 
给 出 这 个 版 本 的 展开 步 又， 看 看 不 同 在 哪里 。 


洞察 其 中 的 区 别 : 如 果 进 入 绑 定 位 置 的 标识 符 是 由 密 的 用 户 提供 的 话 ， 那 么 就 没有 问题 了 。 
因此 ， 我 们 想 要 假装 引入 的 标识 符 是 由 用 户 编写 的 。 函 数 datum->syntax 接收 两 个 参数 ， 第 一 


个 参数 是 语法 ， 它 将 第 二 个 参数 一 一 s-expression 一 一 转换 为 语法 ， 假 装 其 是 第 一 个 参数 的 一 
部 分 (在 我 们 的 例子 中 ， 就 是 宏 的 原始 形式 ， 它 被 绑 定 为 X) 。 为 了 将 其 结果 引入 到 用 于 展开 


的 环境 中 ， 我 们 使 用 with-syntax 在 环境 中 进行 绑 定 : 


(define-syntax (object/self-3 x) 
(syntax-case x () 
[(object [mtd-name (var) val] ...) 
(with-syntax ([self (datum->syntax x 'self)]) 
#'(let ([self (lambda (msg-name) 
(lambda (v) (error 'object "nothing here")))]) 
(begin 
(set! self 
(lambda (msg-name) 
(case msg-name 

[(mtd-name) (lambda (var) val)] 


:….))) 
sel1f)))])) 


于 是 我 们 可 以 隐 式 的 使 用 self 了 : 


(define os-3 
(object/self-3 
[first (x) (msg self 'second (+ x 1))] 
[second (x) (+ x 1)])) 


13.6 对 编译 器 设计 的 影响 


在 一 个 语言 的 定义 中 使 用 宏 对 所 有 其 工具 都 有 影响 ， 特 别 是 编译 器 。 作 为 例子 ， 考 

虑 let 。 let 的 优点 是 ， 它 可 以 被 高 效 的 编译 ， 只 需要 扩展 当前 环境 就 行 了 。 相 比 之 下 ， 
将 let 展开 成 函数 调用 会 导致 更 锅 贵 i 创建 闭 包 ， 再 将 其 应 用 于 参数 ， 实 际 上 获得 的 
效果 是 一 样 的 ， 但 是 花费 更 多 时 间 (通常 还 要 更 多 空间 ) 。 


这 似乎 是 反对 使 用 宏 的 论据 。 不 过 ， 联 明 的 编译 器 会 发 现 这 个 模式 老 是 出 现 ， 并 会 在 其 内 部 
将 左 括 号 左 括 号 lambda 和 转换 回 let 的 等 价 形式 。 这 么 做 有 两 个 好 处 。 第 一 个 好 处 是 ， 语 言 设 
计 者 可 以 自由 地 使 用 宏 来 获得 更 小 的 核心 语言 ， 而 不 必 与 执行 成 本 进行 权衡 。 


第 二 个 好 处 更 微妙 。 因 为 编译 器 能 识别 这 个 模式 ， 其 他 的 宏 也 可 以 利用 它 并 获得 相同 的 优 
化 ; 它们 不 再 需要 捏 曲 自 己 的 输出 ， 如 果 自 然 的 输出 恰好 是 左 括号 左 括号 lambda， 将 其 再 转 
化 成 let (否则 就 必须 这 么 做 ) 。 比 如 说 ， 在 编写 某 些 模式 匹配 (的 宏 ) 的 时 候 ， 左 括号 左 括 
号 lambda 模 式 就 会 自然 的 出 现 ， 而 想 要 将 其 转换 为 let 的 话 就 必须 多 做 一 步 一 一 现在 不 必要 
了 。 


13.7 其 他 语言 中 的 去 语法 糖 


不 仅仅 是 Racket， 许 多 现代 语言 也 通过 去 语法 糖 来 定义 操作 。 例 如 在 Python 中 ，for 和 迭代 就 是 
语法 模式 。 程 序 员 写 下 for x in o 时 ， 他 


e 引入 了 新 标识 符 〈 称 之 为 j， 但 是 ， 不 要 让 其 捕获 了 程序 员 定 义 的 ij， 即 ， 卫 生 的 绑 定 
il! ) ， 
。 将 其 绑 定 到 从 0 获得 的 迭代 器 (iterator) ， 
创建 (可 能 ) 无 限 的 while 循 环 ， 反 复 调 用 i 的 .next 方 法 ， 直 到 迭代 器 引发 Stoplteration 弄 


澡 


币 “ 


现代 编程 语言 中 有 许多 这 样 的 模式 。 


14 控制 指令 


术语 控制 指 的 是 编程 语言 中 任何 使 得 计算 过 程 前 进 的 指令 ， 因 为 它 "控制 "了 计算 机 的 程序 计数 
器 (program counter) 。 从 这 个 意义 上 说 ， 即 使 是 简单 的 算术 表达 式 也 应 该 被 认为 是 一 种 “ 控 

制 ”， 而 像 顺序 执行 、 兄 数 调用 和 返回 这 样 的 操作 ， 就 更 应 该 是 了 。 不 过 ， 实 践 中 我 们 通常 用 

这 个 名 词 指 代 那 些 导致 控制 非 局 部 转移 的 尤其 是 除了 函数 、 过 程 以 及 将 要 学 到 的 异常 
(exception ) 之 外 的 旨 念 。 本 章 我 们 将 学 习 这 类 指令 。 








在 研究 这 些 控制 指令 时 ， 需 要 指出 的 是 ， 即 使 没有 它们 ， 我 们 的 语言 也 是 图 灵 完 备 的 ， 也 就 
是 说 我 们 并 没有 获得 额外 的 "能 力 ”。 因 此 ， 控 制 指令 所 做 的 是 ， 改 变 、 改 善 我 们 的 表达 方式 ， 
从 而 增强 程序 的 结构 。 所 以 ， 专 注 于 程序 的 结构 有 益 于 本 章 的 学 习 。 


14.1 Web 上 的 控制 
让 我 们 从 研究 Web 程 序 的 结构 开始 。 考 虑 下 面 的 程序 : 【注释 】 


(display 
(+ (read-number "First number") 
(read-number "Second number"))) 


今后 ， 我 们 将 把 它 称 为 “加 法 服务 "。 当 然 ， 你 应 该 将 它 理解 为 更 为 复杂 应 用 的 一 个 简化 
版 。 例 如 ， 应 用 可 能 提示 输入 的 是 旅程 的 起 点 和 目的 地 ， 加 法 对 应 的 实际 服务 可 能 是 根 
据 输入 的 起 点 终点 计算 航线 或 者 机 票 的 价格 。 在 两 个 (输入 ) 步骤 之 间 甚 至 可 能 也 有 计 
算 : 例如 ， 在 输入 第 一 个 城市 后 ， 航 空 公司 可 能 会 提示 我 们 可 供 选 择 的 目的 地 。 


为 了 测试 这 些 想法 ， 下 面 是 read-number 的 实现 : 


(define (read-number [prompt : string]) : number 
(begin 
(display prompt) 
(let ([v (read)]) 
(if (s-exp-number? V) 
(Ss-exp->number V) 
(read-number prompt))))) 


在 控制 台 或 DrRacket 中 运行 时 ， 该 程序 会 提示 我 们 输入 一 个 数字 ， 然 后 输入 另 一 个 数字 ， 最 
后 显示 它们 的 总 和 。 

现在 假设 我 们 想 在 Web 服 务 器 上 运行 。 我 们 立即 遇 到 难点 : 服务 器 端 Web 程 序 的 结构 是 这 样 
的 : 它们 生成 一 个 网 页 ， 比 如 请 求 第 一 个 数字 的 网 页 ， 然 后 停止 。 结 果 ， 程 序 的 其 余部 分 
一 一 在 这 里 ， 提 示 第 二 个 数字 ， 然 后 求 和 ， 然 后 打印 结果 一 一 丢失 了 。 


为 什么 Web 服 务 器 的 行为 如 此 奇怪 ? 


这 种 行为 至 少 有 两 个 原因 : 一 个 也 许 是 历史 的 ， 另 一 个 是 技术 的 。 历 史 原 因 是 Web 服 务 器 最 
初 设计 为 供应 页 面 ， 即 静态 内 容 。 任 何 程序 的 运行 都 必须 将 其 输出 生成 为 文件 ， 服 务 器 将 该 
文件 提供 给 客户 端 。 很 自然 的 ， 开 发 人 员 想 到 为 什么 同样 的 程序 在 web 上 就 不 能 按 需 运行 。 于 
是 ， 后 来 Web 上 出 现 了 动态 内 容 。 构 成 Web 应 用 的 最 小 增 量 单元 不 再 是 页 面 ， 而 是 一 个 个 执 
行 结束 后 生成 页 面 各 个 部 分 所 需 内 容 的 程序 。 


更 重要 的 原因 也 是 导致 目前 状况 的 原因 是 技术 性 的 。 想 象 一 下 ， 我 们 的 加 法 服务 器 
已 经 生成 了 第 一 个 提示 。 回 想 一 下 ， 有 相当 多 的 计算 要 进行 : 第 二 个 提示 ， 求 和 和 显示 结 

果 。 这 些 计算 必须 暂停 ， 等 待 用 户 的 输入 。 如 果 有 成 千 上 万 的 用 户 ， 那 么 必须 暂停 成 十 上 万 
的 计算 ， 这 会 产生 巨大 的 性 能 问题 。 此 外 ， 假 设 用 户 实际 上 没有 完成 计算 一 一 类 似 于 在 网 上 
书店 或 航空 公司 网 站 上 搜索 ， 而 不 完成 购买 。 服 务 器 如 何 知 道 何 时 终止 计算 ， 其 至 是 否 终 止 
计算 ? 而 在 终止 之 前 ， 与 该 计算 相关 的 资源 仍 被 占用 。 








此 ，Web 协 议 从 其 概念 上 就 被 设计 为 无 状态 的 〈stateless) : 它 不 将 与 中 间 计 算 相关 的 状 
态 存 储 在 服务 器 上 。 这 使 得 Web 程 序 员 被 迫 在 其 他 地 方 维护 所 有 必要 的 状态 ， 每 个 请 求 都 需 
要 携带 能 够 完全 恢复 计算 所 需 的 状态 。 在 实践 中 ，VWeb 并 不 都 是 完全 无 状态 的 ， 但 是 它们 在 
很 大 程度 上 倾向 这 个 方向 ， 因 此 研究 这 类 程序 的 结构 是 非常 有 教 益 的 。 


接 下 来 考虑 一 下 客户 端的 Web 程 序 : 那些 在 浏览 器 中 运行 的 程序 ， 通 常用 JavaScript 编 写 ， 或 
被 编译 成 JavaScript。 假 设 某 个 计算 需要 与 服务 器 进行 通信 。 (JavaScript 提 供 的 ) 指令 为 
XMLHttpRequest。 用 户 创建 这 个 指令 的 实例 ， 然 后 调用 其 send 方法 向 服务 器 发 送 消息 。 然 
而 ， 与 服务 器 通信 并 不 是 即时 的 〈 并 且 根 据 网 络 的 状态 ， 实 际 上 可 能 永远 不 会 完成 ) 。 这 导 
致 发 送 进程 被 挂 起 。 


JavaScript 的 设计 者 决定 让 该 语言 是 单线 程 的 ， 即 ， 任 意 时 间 只 能 有 一 个 线程 在 执行 。【 注 
释 】 这 避免 了 赋值 与 线程 结合 而 产生 的 各 种 风险 。 因 此 ，JavaScript 进 程 会 被 锁定 以 等 待 响 
应 ， 这 期 间 不 可 能 做 任何 其 他 事情 : 例如 ， 页 面 上 的 其 他 处 理 程序 不 再 响应 。 


因为 这 会 导致 结构 性 问题 ， 现 在 有 各 种 提议 ， 实 际 上 是 要 为 JavaScript 添 加 “安全 的 ? 线 
程 。 本 章 所 描述 的 想法 可 以 被 看 作 是 另 一 种 方案 ， 提 供 类 似 的 结构 优势 。 


为 了 避免 这 个 问题 ，XMLHttpRequest 的 设计 要 求 开 发 者 提供 一 个 函数 来 响应 请 求 〈 请 求 到 达 
时 将 调用 该 程序 ) 。 该 回调 函数 在 系统 中 注册 。 需 要 传递 请 求 结果 给 该 回调 函数 让 其 完成 后 
续 处 理 过 程 。 因 此 ， 并 非 处 于 性 能 方面 的 考虑 ， 而 是 为 了 避免 同步 、 非 原子 性 和 死 锁 问 题 ， 
客户 端 Web 也 发 展 出 相同 的 程序 模式 。 让 我 们 更 好 地 理解 这 种 模式 。 


14.1.1 将 程序 分 解 成 现在 和 以 后 


我 们 来 考虑 如 何 让 上 述 程 序 在 无 状态 的 环境 下 一 一 比如 在 Web 服 务 器 上 一 一 工作 。 首 先 我 们 
需要 确定 第 一 个 交互 ， 是 提示 输入 第 一 个 数字 ， 因 为 Racket 从 左 到 右 计算 参数 。 将 程序 分 成 
两 部 分 是 有 益 的 : 第 一 个 交互 产生 哈 (现在 就 可 以 运行 ) ， 以 及 之 后 需要 发 生 什 么 (必须 以 
某 种 方式 “ 记 住 ”) 。 前 者 很 容易 : 


(read-number "First number") 
我 们 已 经 用 文字 解释 过 剩 下 的 东西 了 ， 但 是 现在 是 时 候 把 它 写 成 程序 了 。 似 乎 应 该 类 似 于 
【注释 】 


(display | 
(+ < 第 一 个 交互 的 返回 值 > 
(read-number "Second number"))) 


我 们 现在 故意 忽略 read-number 部 分 ， 但 会 回 过 来 讨论 它 。 现 在 ， 我 们 假设 它 是 内 置 的 。 
但 是 ，Web 服 务 器 不 能 执行 这 个 东西 ， 因 为 它 显然 不 是 程序 。 我 们 需要 一 种 方式 将 其 写成 程 
序 o 
观察 一 下 这 个 计算 的 特点 


这 
合法 的 程序 。 

需要 保持 暂停 状态 ， 直 到 请 求 进入 
需要 某 种 方式 例如 参数 一 一 来 引用 前 一 个 交互 的 值 。 





Nt 

站 
宁 
[ry 
必 


特点 ， 显 然 我 们 应 该 将 其 表示 为 函数 : 


(lambda (v1) 
(display 
(+ v1 
(read-number "Second number")))) 


14.1.2 部 分 的 解决 方案 


在 Web 上 ， 还 有 个 额外 的 问题 : 每 个 带 有 输入 元 素 的 Web 页 面 都 需要 引用 存储 在 Web 上 的 程 

序 ， 该 程序 将 从 表单 接收 数据 并 对 其 进行 处 理 。 这 个 程序 是 在 表单 的 action 字 段 中 指明 的 。 

此 ， 设 想 服 务 器 生成 一 个 新 的 标签 ， 将 前 述 函 数 存 储 在 人 关联 的 表格 中 ， 并 且 在 

ee he i 。 如 果 客 户 端 最 终 提交 了 表单 ， 这 个 时 候 ， 服 务 器 提取 出 关联 的 函 
向 其 提供 表单 的 值 ， 从 而 恢复 执行 


思考 是 
上 述 方案 是 无 状态 的 吗 ? 


假设 我 们 在 自 定 义 的 Web 服 务 器 上 维护 这 么 一 个 表格 。 在 这 个 服务 器 上 ， 可 能 会 有 一 个 特殊 
版 本 的 read-number， 称 之 为 call-read-number/suspend， 记 录 程 序 的 其 余部 分 : 


(read-number/suspend "First number" 
(lambda (v1) 
(display 
(+ v1 
(read-number "Second number"))))) 


为 了 测试 ， 我 们 来 实现 这 个 子 程序 。 首 先 ， 我 们 需要 标签 的 表示 法 ; 用 数字 就 好 : 


(define-type-alias label number ) 


假设 new-label 在 每 次 调用 时 都 会 生成 新 标签 。 
练习 
定义 new-label 。 需 要 的 话 参 考 new-loc 以 获得 灵感 。 


需要 一 个 表 ， 来 存储 代表 程序 其 余部 分 的 子 程序 。 


(define table (make-hash empty)) 


存储 这 些 子 程序 : 


(define (read-number/suspend [prompt : string] rest) 
(let ([g (new-label)]) 
(begin 
(hash-set! table g rest) 
(display prompt) 
(display " To enter it, use the action field label ") 
(display 9g)))) 


现在 运行 上 面 的 read-numbersuspend 调 用 ， 系 统 会 打印 


First number To enter it, use the action field Label 1 


这 就 相当 于 ， 在 Web 页 面 中 打印 提示 ， 并 在 action 字 段 中 放 入 “标签 9。 因为 我 们 在 模拟 网 页 ， 
需要 有 个 东西 来 表示 浏览 器 的 提交 过 程 。 这 里 需要 标签 (来 自 action 字 段 ) 和 表单 中 输入 的 
值 。 给 定 了 这 两 个 值 ， 这 个 子 程序 需要 从 表 中 提取 出 相关 子 程序 ， 并 将 其 应 用 于 表单 值 。 


(define (resume [g : label] [n : number]) 
((some-v (hash-ref table g)) n)) 


有 了 这 些 ， 我 们 现在 可 以 模拟 输入 3 并 点 击 “ 提 交 ?" 按 钮 的 行为 ， 运 行 : 


> (resume 1 3) 


其 中 1 是 标签 ，3 是 用 户 输 入 。 不 幸 的 是 ， 这 么 做 只 会 产生 另 一 个 提示 ， 因 为 我 们 还 没有 完成 
程序 的 转换 。 要 去 除 read-number， 我 们 需要 转换 整个 程序 : 


(read-number/suspend "First number" 
(lambda (v1) 
(read-number/suspend "Second number" 
(lambda (v2) 
(display 
(+ v1 v2)))))) 


为 了 安全 起 见 ， 我 们 还 可 以 在 read-number/suspend 结 束 的 地 方 添加 报错 ， 从 而 确保 计算 在 每 
次 输出 之 后 终止 (以 确保 “ 挂 起 ”的 最 极端 形式 ) 。 


执行 这 个 程序 时 ， 必 须 两 次 使 用 resume : 


First number To enter it, use the action field label 1 
halting: Program shut down 

> (resume 1 3) 

Second number To enter it, use the action field label 2 
halting: Program shut down 

> (resume 2 10) 

13 


其 中 两 次 用 户 输入 分 别 是 3 和 10， 总 和 给 出 是 13， 而 


halting 


言 息 是 我 们 添加 的 报错 命令 生成 的 。 


我 们 故意 略 去 了 程序 中 茶 些 有 趣 部 分 的 类 型 。 来 看 看 这 些 类 型 应 该 是 什么 。read- 
number/suspend 的 第 二 个 参数 是 读 入 数字 并 返回 最 终结 果 的 子 程序 : (number -> 'a) 。 同 
样 ，resume 的 返回 类 型 也 是 'a 。 这 些 'a 如 何 相 互 沟通 ? 是 通过 将 标签 映射 

到 (number -> “al) 的 表 完 成 的 。 也 就 是 说 ， 计算 过 程 中 的 每 一 步 都 产 生 相 同类 型 的 结 

果 。 read-number/suspend 写 入 表 中 ” resume 从 表 中 读 取 上 


14.1.3 实现 无 状态 


实际 上 我 们 并 没有 实现 无 状态 ， 因 为 服务 器 上 有 一 大 张 表 ， 而 我 们 缺乏 明确 手段 去 除 此 表 。 
如 果 可 以 完全 避免 服务 器 上 的 状态 就 好 了 。 这 意味 着 我 们 必须 将 相关 的 状态 移交 给 客户 端 。 
服务 器 实际 上 以 两 种 方式 持 有 了 状态 。 其 一 ， 可 以 存放 任意 多 个 一 而 不 是 常数 个 (比如 线 


性 相关 于 程序 本 身 的 大 小 ) 条 目的 哈 希 表 ，。 其 二 ， 我 们 在 表 中 存放 的 是 实 实在 在 的 闭 
包 ， 而 闭 包 中 可 以 保有 任意 数量 的 状态 。 我 们 很 快 就 会 更 清楚 地 看 到 这 一 点 。 





先 从 消除 闭 包 开始 着 手 。 我 们 可 以 把 所 有 的 函数 参数 改 成 实名 的 全 局 函数 (这 和 连 使 我 们 只 会 
拥有 有 限 个 闭 包 ， 因 为 程序 的 长 度 不 可 能 是 无 限 的 ) 


(read-number/stateless "First number" prog1) 


(define (prog1 v1) 
(read-number/stateless "Second number" prog2)) 


(define (prog2 v2) 
(display (+ v1 v2))) 


注意 到 每 块 代码 都 只 引用 下 一 块 代码 的 名 称 ， 而 没有 引入 盖 正 的 闭 包 。 参 数 的 值 来 自 于 表 
单 。 唯 一 的 问题 是 : prog2 中 的 v1 是 未 绑 定 的 标识 符 ! 

解决 这 个 问题 的 方法 是 ， 不 要 在 每 一 步 之 后 创建 闭 包 ， 而 是 将 v1 发 送 到 客户 端 并 存储 在 那 
里 。 存 储 在 哪里 呢 ? 浏览 器 为 此 提供 了 两 种 机 制 : Cookie 和 隐藏 字段 。 我 们 用 哪 一 个 ? 
14.1.4 与 状态 互动 


Cookie 和 隐藏 字段 之 间 的 本 质 区 别 是 ， 所 有 页 面 共 享 相 同 的 cookie， 但 每 个 页 面 都 包含 自己 
的 隐藏 字段 。 


先 来 考虑 与 现 有 程序 的 一 串 交 互 ， (在 两 个 地 方 都 ) 使 用 read-number/suspend。 就 像 这 样 : 


First number To enter it, use the action field label 1 
> (resume 1 3) 

Second number To enter it, use the action field label 2 
> (resume 2 10) 

13 


因此 ， 恢 复 标签 2 似乎 表示 将 3 加 到 给 定 的 参数 ( 即 ， 表 单字 段 值 ) 。 保 险 起 见 ， 


> (resume 2 15) 
18 


一 切 正常 。 现 在 假设 我 们 再 次 使 用 标签 1 : 


> (resume 1 5) 
Second number To enter it, use the action field label 3 


注意 ， 需 要 使 用 标签 3， 而 不 是 标签 1 来 恢复 这 个 新 的 程序 执行 。 的 确 ， 


> (resume 3 10) 
15 


但 是 我 们 应 该 问 ， 如 果 重 用 标签 2 会 发 生 什 么 ? 
思考 题 


试 试 (resume 2 10) 


这 就 是 恢复 之 前 的 计算 。 因 此 ， 我 们 期 望 它 产生 和 之 前 一 样 的 结果 : 


> (resume 2 10) 
13 


现在 来 创建 一 个 有 状态 的 实现 。 通 过 共享 一 个 可 变 状 态 但 是 拥有 自己 环境 的 闭 包 可 以 模拟 这 
种 行为 。 所 以 我 们 可 以 这 样 做 ， 使 用 现 有 的 read-number/suspend， 但 是 不 依赖 lambda 的 闭 
包 行 为 ， 即 不 使 用 任何 自由 变量 。 


(define cookie '-100) 


(read-number/suspend "First number" 
(lambda (v1) 
(begin 
(set! cookie v1) 
(read-number/suspend "Second number" 
(lambda (v2) 
(display 
(+ cookie v2))))))) 


练习 

对 于 之 前 的 交互 序列 ， 现 在 的 期 望 值 是 哈 ? 
思考 是 

计算 过 程 是 什么 样 的 ? 
起 初 ， 似 乎 没 啥 不 同 : 


First number To enter it, use the action field label 1 


> (resume 1 3) 
Second number To enter it, use the action field label 2 


> (resume 2 10) 
13 


当 再 次 使 用 最 初 的 计算 时 ， 我 们 确实 得 到 新 的 恢复 标签 : 


> (resume 1 5) 
Second number To enter it, use the action field label 3 


使 用 新 标签 时 ， 计 算 结 果 如 我 们 所 期 望 的 : 


> (resume 3 10) 
并 总 


关键 的 一 步 来 了 : 


> (resume 2 10) 
15 


标签 2 的 两 次 恢复 产生 了 不 同 的 答案 ， 这 一 点 不 足 为 奇 ， 因 为 它们 依赖 于 可 变 状态 。 问 题 是 ， 
当 我 们 将 相同 的 行为 转换 到 Web 时 会 发 生 什么 。 


想象 一 下 ， 访 问 某 旅 馆 预 订 网 站 ， 寻 找 某 个 城市 的 旅馆 。 返 回 的 网 页 中 ， 你 看 到 一 个 旅馆 的 
链表 和 标签 1。 你 在 新 (浏览 器 ) 标签 或 窗口 中 浏览 其 中 的 一 个 旅馆 ; 这 个 页 面 中 生成 了 那个 
旅馆 的 信息 ， 还 有 标签 2 用 作 预 订 旅 馆 。 然 而 ， 你 返回 旅馆 链表 ， 并 在 新 的 标签 或 窗口 中 查看 
了 另 一 家 旅馆 。 这 产生 了 第 二 家 旅馆 的 信息 ， 还 有 标签 3 用 作 该 旅馆 的 预订 。 然 而 ， 你 决定 选 
择 第 一 家 旅馆 ， 返 回 第 一 家 旅馆 的 页 面 ， 然 后 选择 预订 按钮 ， 也 就 是 提交 了 标签 2。 你 想 要 预 
订 的 是 哪 家 旅馆 ? 尽管 你 预期 订 的 是 第 一 家 ， 大 多 数 旅 游 网 站 上 ， 你 要 么 预订 了 第 二 家 旅馆 
一 一 即 最 后 查看 的 ， 而 不 是 预订 按钮 所 在 的 网 页 上 的 那 家 一 一 要 么 被 报告 错误 。 这 是 因为 在 
Web 站 点 普遍 使 用 了 cookie， 这 是 大 多 数 Web API 所 鼓励 的 做 法 。 


14.2 Continuation 传 递 模式 


之 前 所 说 的 函数 是 有 名 称 的 。 虽 然 用 Web 描 述 问 题 ， 但 是 我 们 用 的 是 更 古老 的 概念 : 这 类 函 
数 被 称 为 continuation (延续 ) ， 而 这 种 风格 的 程序 被 称 为 continuation-passing 

style (Continuation 传 递 模 式 ， 简 称 CPS) 。【 注 释 】 这 值得 研究 一 下 ， 因 为 它 是 学 习 其 他 
各 种 非 平 凡 控 制 指令 一 一 如 生成 器 的 基础 。 








我 们 会 自由 地 将 CPS 当 作 名 词 和 动词 使 用 : 一 种 特定 的 代码 模式 ， 将 代码 转化 为 此 种 模 


此 前 ， 我 们 将 程序 转化 为 ， 没 有 Web 输 入 操作 瞬 套 在 另 一 个 中 。 动 机 很 简单 : 当 程 序 终止 
时 ， 所 有 嵌 套 的 计算 都 会 丢失 。 对 于 XMLHttpRequest 来 说 ， 类 似 的 论据 (在 程序 本 地 意义 
上 ) 成 立 : 所 有 依赖 于 Web 服 务 器 响应 结果 的 计算 ， 都 需要 驻 留 在 对 服务 器 请 求 相 关联 的 回 
调 中 。 


事实 上 ， 我 们 并 不 需要 转化 每 一 个 表达 式 。 只 需要 处 理 涉及 实际 Web 交 互 的 表达 式 。 比 如 
说 ， 如 果 要 进行 的 计算 不 是 加 法 ， 而 是 比 它 复杂 得 多 的 数学 表达 式 ， 这 个 数学 表达 式 我 们 是 
不 需要 转换 的 (不 涉及 Web 交 互 ) 。 不 过 ， 如 果 这 里 有 个 函数 调用 ， 那 么 我 们 必须 绝对 确定 
这 个 函数 、 它 调用 的 函数 、 这 些 函数 调用 的 函数 (整个 调用 链 ) 中 不 存在 任何 的 Web 调 用 ， 
才 可 以 不 对 它 进行 转换 。 否 则 ， 保 险 起 见 ， 我 们 必须 转化 所 有 的 这 些 函 数 。 总 之 ， 我 们 必须 
转化 每 个 我 们 无 法 确定 不 执行 任何 Web 交 互 的 表达 方式 。 


因此 ， 这 里 转化 的 核心 就 是 把 每 个 单 参数 函数 f 转换 成 具有 额外 参数 的 函数 。 这 个 额外 的 参 
数 就 是 continuation， 代 表 了 其 余 的 计算 。Continuation 本 身 也 是 单 参数 的 函数 。 这 个 参数 的 
输入 是 f 本 来 的 返回 值 ， 后续 计算 本 来 需要 使 用 这 个 返回 值 继续 。 转 换 后 f 将 不 再 返回 值 ， 
而 是 将 原来 的 返回 值 传递 给 它 的 continuation。 


CPS 是 种 通用 的 转化 ， 可 以 作用 在 任何 程序 上 。 因 为 它 是 一 种 程序 转换 ， 所 以 我 们 可 以 把 它 
看 作 是 特殊 的 去 语法 糖 : 特别 之 处 是 ， 它 不 是 把 程序 从 大 语言 转化 到 小 语言 (类似 于 宏 ) ， 
或 者 从 一 种 语言 转化 到 另 一 种 语言 (就 像 编 译 器 那样 ) ， 而 是 在 同一 种 语言 中 的 程序 转换 : 


从 完整 语言 转化 到 受 限 制 的 形式 ， 遵 从 这 里 讨论 的 模式 。 因 此 ， 我 们 可 以 使 用 完整 语言 的 求 
值 器 对 CPS 程 序 求 值 。 


14.2.1 用 去 语法 糖 实 现 


我 们 已 经 对 去 语法 糖 有 了 很 好 的 支持 ， 所 以 我 们 来 它 来 定义 CPS 转 换 。 具 体 来 说 ， 我 们 将 实 
现 CPS 宏 。 为 了 更 加 干净 地 将 源 语言 与 目标 语言 分 开 ， 我 们 所 使 用 的 大 部 分 语言 结构 都 会 用 
略 有 不 同 的 名 称 : 单 变量 的 rec 和 with 而 不 是 let 和 letrec ; lam 而 不 是 lambda ; cnd 而 不 是 if ; 
seq 取 代 begin ; set 取 代 setl。 这 会 是 足够 丰富 的 语言 ， 可 以 编写 一 些 有 趣 的 程序 ! 


后 文中 宏 的 子 多 按照 我 认为 从 容易 到 困难 的 顺序 排列 。 但 是 ， 宏 定义 的 代码 必须 避免 模 
式 的 重复 ， 因 此 遵循 不 同 的 顺序 。 


<cps-macro> ::= ;CPS 宏 


(define-syntax (cps e) 
(syntax-case e (with rec lam cnd seq set quote display read-number) 

<cps-macro-with-case> 
<cps-macro-rec-case> 
<cps-macro-lam-case> 
<cps-macro-cnd-case> 
<cps-macro-display-case> 
<cps-macro-read-number-case> 
<cps-macro-seq-case> 
<cps-macro-set-case> 
<cps-macro-quote-case> 
<cps-macro-app-1-case> 
<cps-macro-app-2-case> 
<cps-macro-atomic-case>)) 


我 们 的 CPS 表 示 法 会 将 每 个 表达 式 转变 成 单 参 数 的 函数 ， 参 数 就 是 continuation。 和 转换 后 的 表 
达 式 最 终 要 么 提供 值 调 用 continuation， 要 么 将 continuation 传 递 给 其 他 表达 式 ， 归 纳 地 说 ， 其 
他 表达 式 也 遵从 这 个 不 变量 关系 ， 因 此 最 终 continuation 会 被 提供 某 个 值 。 所 以 说 ， 所 有 的 
CPS 输 出 看 起 来 都 类 似 于 (lambda (k) ...) (我 们 将 依赖 卫生 来 保证 所 有 引入 的 k 不 会 相互 冲 
突 ) 。 

首先 ， 我 们 来 处 理 简单 的 情况 ， 原 子 值 。 尽 管 概念 上 来 说 它 是 最 简单 的 ， 但 是 我 们 将 其 放 在 
最 后 一 项 ， 因 为 放 在 前 面 的 话 它 会 遮盖 掉 其 他 匹配 。 (理想 情况 下 ， 我 们 应 该 将 其 放 在 第 一 
个 位 置 ， 然 后 提供 一 个 能 精确 定义 我 们 原子 值 的 匹配 表达 式 ， 这 里 放宽 要 求 是 因为 我 们 对 其 
他 情况 更 为 关心 。) 原子 值 的 情况 中 ， 我 们 已 经 有 一 个 值 ， 将 其 传递 给 continutaion 即 可 : 


<cps-macro-atomic-case> ::= ;原子 
[( atomic) 


#'(lambda (Kk) 
(k atomic))] 


被 引用 的 常量 也 一 样 处 理 : 


<cps-macro-quote-case> ::= 


Ne) 
#'(lambda (k) (k 'e))] 


我 们 还 知道 ，with 和 rec 可 以 当 作 宏 来 处 理 : 


<cps-macro-with-case> ::= 


[(- (with (v e) b)) 
#'(cps ((lam (v) b) e))] 
<cps-macro-rec-case> ::= 

[(- (rec (v f) b)) 

#'(cps (with (v (lam (arg) (error 'dummy "nothing"))) 
(seq 
(set v f) 
b)))] 


赋值 也 是 容易 的 : 先 求 出 新 的 值 ， 然 后 再 执行 实际 的 更 新 操作 : 


<cps-macro-set-case> ::= 


[(- (set v e)) 
#'(lambda (Kk) 
((cps e) (lambda (ev) 
(k (set! v ev)))))] 


序列 指令 也 是 直 白 的 : 依次 执行 每 个 操作 。 请 注意 我 们 保持 了 序列 的 语义 : 不 仅 遵 守 了 操作 
的 顺序 ， 第 一 个 子 项 (e1) 的 值 在 第 二 个 (e2) 的 计算 中 不 会 被 用 到 ， 所 以 该 值 所 绑 定 到 的 
标识 符 的 名 称 也 就 无 关 紧 要 。 


<cps-macro-seq-case> : := 


[(- (seq el e2)) 
#'(lambda (k) 
((cps e1) (lambda (_) 
((cps e2) k))))] 


处 理 条 件 指令 时 ， 需 要 创建 新 的 continuation， 用 来 记 住 我 们 在 等 待 条 件 表达 式 的 求 值 结果 
获得 了 其 值 ， 根 据 其 值 的 不 同 我 们 可 以 选择 进入 已 有 的 continuation 分 支 。 


<cps-macro-cnd-case> a 


[(_ (cnd tst thn els)) 
#'(lambda (Kk) 
((cps tst) (lambda (tstyv) 
(If tstv 
((cps thn) k) 
((cps els) k)))))] 


处 理 函 数 调用 时 ， 有 两 种 情况 需要 考虑 。 我 们 必须 要 处 理 语 言 中 创建 的 函数 ， 也 就 是 单 参数 
函数 。 然 而 ， 为 了 编写 示例 程序 ， 能 够 使 用 诸如 + 和 * 之 类 的 指令 很 有 用 。 因 此 ， 为 了 简单 起 
见 ， 我 们 将 假定 单 参数 函数 是 用 户 编写 的 ， 因 此 需要 CPS 转 换 ， 而 双 参 数 函 数 是 不 会 执行 任 
何 Web 或 其 他 控制 操作 的 指令 ， 因 此 可 以 直接 调用 ; 我 们 还 假定 原生 指令 可 以 直接 写 出 

( 即 ， 兄 数位 置 不 是 复杂 表达 式 ， 本 身 不 会 执行 Web 交 互 ) 。 


对 于 函数 调用 ， 我 们 必须 先 对 函数 和 参数 表达 式 求 值 ， 一 旦 获取 了 这 些 就 可 以 实际 进行 函数 
的 调用 。 因 此 我 们 很 容 钨 将 函数 调用 的 转换 写成 这 样 : 


<cps-macro-app-1-case-take-1> ::= 


[(- (f a)) 
#'(lambda (Kk) 
((cps f) (lambda (fv) 
((cps a) (lambda (av) 


(k (fv av)))))))] 


思考 是 
你 看 出 为 什么 这 是 错 的 吗 ? 


问题 在 于 ， 虽 然 函 数 现在 是 值 了 ， 也 就 是 闭 包 ， 其 函数 体 可 以 很 复杂 : 比如 说 ， 对 函数 体 求 
值 可 以 导致 进一步 的 Web 交 互 ， 此 时 函数 体 的 其 余部 分 ， 包 括 待 处 理 的 〈(k ...) ( 即 程序 的 
其 余部 分 ) 将 全 部 丢失 。 为 了 避免 这 种 情况 ， 我 们 必须 把 k 提 供给 函数 的 值 ， 让 归纳 不 变量 保 
证 Kk 最 终 会 被 调用 于 fy 作用 于 av 的 得 到 的 值 : 


<cps-macro-app-1-case> ::= 


[(- (f a)) 
#'(lambda (Kk) 
((cps f) (lambda (fv) 
((cps a) (lambda (av) 
(fv av k))))))] 


处 理 内 置 双 目 操作 的 特殊 情况 比较 容易 : 


<cps-macro-app-2-case> ::= 
[(- (f a b)) 
#'(lambda (Kk) 
((cps a) (lambda (av) 
((cps b) (lambda (bv) 
(k (f av bv)))))))] 


用 户 定义 的 函数 不 能 使 用 这 个 模式 ， 因 为 我 们 假设 这 里 {f 的 调用 总 是 会 返回 ， 而 不 进行 任何 不 
寻常 的 控制 转移 。 
光 数 本 身 就 是 一 种 值 ， 该 值 本 身 应 该 被 返回 给 挂 起 的 计算 (一 个 continuation) 。 然 而 ， 前 面 


函数 调用 的 情况 表明 ， 函 数 转 化 后 需要 传 入 额外 的 参数 调用 点 的 continuation。 这 就 留 下 
一 个 问题 : 该 向 函数 体 提 供 哪个 continuation ? 





<cps-macro-lam-case-take-1> : := 


[(- (lam (a) b)) 
(identifier? #'a) 
#'(lambda (Kk) 
(k (lambda (a dyn-k) 
((cps b) ...))))] 


也 就 是 说 ， 在 这 里 的 ... 位 置 上 ， 我 们 该 填 入 k 还 是 dyn-k ? 
思考 是 
该 十 入 哪个 continuation 呢 ? 


前 者 是 闭 包 创建 位 置 的 continuation。 后 者 是 闭 包 调 用 位 置 的 continuation。 换 一 种 说 法 ， ee 
是 “静态 的 ”， 后 者 是 “动态 的 "。 这 里 ， 我 们 需要 使 用 动态 的 continuation， 否 则 

的 事情 : 程序 会 返回 到 创建 闭 包 的 地 方 ， 而 不 是 它 被 使 用 的 地 方 ! 这 会 导致 非常 
行为 ， 所 以 我 们 避免 这 么 做 。 请 注意 ， 这 里 我 们 有 意识 地 选择 动态 的 continuation， 就 如 同 在 
处 理 作用 域 时 ， 我 们 选择 了 静态 的 环境 。 


<cps-macro-lam-case> 


[(- (lam (a) b)) 
(identifier? #'a) 
#'(lambda (Kk) 
(k (lambda (a dyn-k) 
((cps b) dyn-k))))] 


最 后 ， 为 了 建 模 Web 编 程 的 目的 ， 我 们 需要 添加 输入 和 输出 指令 。 输 出 遵循 前 述 函数 调用 的 
模式 : 


<cps-macro-display-case> ::= 
[(_ (display output)) 
#'(lambda (Kk) 
((cps output) (lambda (ov) 
(k (display ov)))))] 


对 于 输入 ， 使 用 现 有 的 read-numbersuspend 就 可 以 了 ， 不 过 这 里 由 我 们 来 生成 其 使 用 ， 而 不 
是 让 程序 员 来 创建 : 


<cps-macro-read-number-case> ::= 


[(_ (read-number prompt)) 
#'(lambda (Kk) 
((cps prompt) (lambda (pv) 
(read-number/suspend pv k))))] 


请 注意 ， 绑 定 为 k 的 continuation 就 是 在 Web 交 互 处 我 们 需要 存储 的 continuation 。 


测试 CPS 转 换 后 的 代码 有 些小 麻烦 ， 因 为 所 有 CPS 项 都 需要 读 入 continuation。 最 初 的 
continuation 可 以 是 (a) 读 入 值 并 返回 它 ， 或 者 (b) 读 入 值 并 打印 它 ， 或 者 (Cc) 读 入 值 ， 
打印 它 并 准备 好 进行 下 一 个 计算 (DrRacket 的 交互 窗口 就 是 这 么 做 的 ) 。 这 三 者 其 实 都 只 是 
恒 等 函 数 的 变 体 。 所 以 ， 我 们 定义 以 下 函数 辅助 测试 : 


(define (run c) (c identity) ) 


例如 ， 
(test (run (cps 3)) 3) 
(test (run (cps ((lam () 5) ) ) ) 5) 
(test (run (cps ((lam (x) (0 Xx) 5S) 25) 
(test (run (cps (+ 5 ((lam (x) (* x x)) 5)))) 30) 


也 可 以 测试 之 前 的 Web 程 序 : 


(run (cps (display (+ (read-number "First") 
(read-number "Second"))))) 


为 了 避免 你 迷失 在 众多 代码 之 中 ， 我 强调 一 下 这 里 的 重点 : 我 们 恢复 了 代码 的 结构 。 换 种 说 
法 ， 即 借 由 恰当 的 谋 套 表达 式 以 及 帮助 将 其 翻译 以 使 其 可 以 和 底层 API 协 作 的 代码 的 编译 器 
(本 例 中 即 CPS 转 换 程 序 ) ， 我 们 得 以 使 用 直 述 的 风格 (direct style) 编写 程序 。 这 正 是 优 
秀 的 编程 语言 所 应 做 的 ! 


14.2.2 例子 的 转化 


让 我 们 来 看 看 上 面 的 例子 是 怎么 转换 的 。 你 可 以 手工 操作 ， 也 可 以 采取 简单 的 办 法 ， 用 
Prack ot lac Stepper ( 宏 步 进 器 ) 完成 。【 注 释 】 放 入 run 兄 数 传 入 的 恒 等 函 数 ， 我 们 
得 到 : 


(lambda (k) 
((lambda (k) 
((lambda (k) 
((lambda (k) 
(k "First")) (lambda (pv) 
(read-number/suspend pv k)))) 
(lambda (lv) 
((lambda (k) 
((lambda (k) 
(k "Second")) (lambda (pv) 
(read-number/suspend pv k)))) 
(lambda (rv) 
(k (+ lv rv))))))) 
(lambda (ov) 
(k (display ov))))) 


这 里 ， 为 了 获取 的 Macro Stepper 的 全 部 功能 ， 请 使 用 #1ang racket 语言 。 


什么 ! 这 和 我 们 手写 的 版 本 完全 不 同 |! 


实际 上 ， 这 个 程序 中 充满 了 所 谓 的 管理 性 lambda (administrative lambda) ， 由 我 们 所 用 的 
CPS 算 法 引入 。【 注 释 】 请 不 用 担心 ! 如 果 我 们 逐一 调用 这 些 lambda， 完 成 替代 ， 那 么 


思考 题 


一 一 这 个 程序 会 简化 为 


(read-number/suspend "First" 
(lambda (1v) 
(read-number/suspend "Second" 
(lambda (rv) 
(identity 
(display (+ lv rv))))))) 


这 正 是 我 们 想 要 的 。 


设计 更 好 的 CPS 算 法 ， 消 除 不 必要 的 管理 性 lambda， 是 个 研究 前 沿 问 题 


14.2.3 在 核心 中 实现 
在 研究 了 通过 去 语法 糖 实 现 CPS 之 后 ， 我 们 应 该 问 问 ， 是 否 可 将 其 以 放 在 核心 中 。 


回想 一 下 ， 我 们 说 过 CPS 适 用 于 任何 程序 。 有 一 个 我 们 特别 感 兴趣 的 程序 : 解释 器 。 显 然 ， 
我 们 可 以 将 CPS 转 换 应 用 于 其 上 ， 从 而 获得 事实 上 的 continuation 。 


首先 ， 这 里 使 用 函数 来 表示 闭 包 较为 方便 〈 译 注 ，12.1 节 ) 。 我 们 让 解释 器 读 入 多 读 入 一 个 
参数 ， 该 参数 读 入 值 (需要 传 给 continuation 的 那些 值 ) 并 最 终 返 回 它们 : 


<cps-interp> ::= ;cps 解 释 器 


(define (interp/k [expr : EXxprCc] [env : Env] [k : (Value -> Value)]) : Value 
<cps-interp-body>) ;cps 解 释 器 主体 


对 于 简单 的 情况 ， 我 们 不 直接 返回 值 ， 而 是 将 其 传递 给 continuation 参 数 即 可 : 


<cps-interp-body> : := 


(type-case ExprC expr 
[numC (Nn) (k (Cnumv n))] 
[idc (n) (k (lookup n env))] 
<cps-interp-plusC-case> 
<cps-interp-appC-case> 
<cps-interp-lamC-case>) 


(请 注意 ，multC 的 处 理 完全 类 似 于 plusC。) 


还 是 从 简单 的 情况 开始 ，plusC。 第 一 步 我 们 解释 左 子 表达 式 。 该 计算 的 continuation 进 行 右 
子 表达 式 的 解释 。 这 个 计算 的 continuation 对 结果 求 和 。 求 和 的 结果 怎么 处 理 ? 在 interp 中 ， 它 
被 返回 ， 返 回 到 那个 调用 解释 plusC 的 计算 。 请 记 住 ， 现 在 我 们 不 再 返回 值 ; 反之 ， 我 们 将 其 


传 给 continuation : 


<cps-interp-plusC-case> ::= 
[plusCc (1 r) (interp/k 1 env 
(lambda (lv) 
(interp/k r env 
(lambda (rv) 
(k (Cnum+ lv rv))))))] 


习题 
实现 multC 。 
还 剩 下 两 种 相互 关联 的 情况 ， 它 们 相对 更 难 些 。 


对 于 函数 调用 ， 还 是 需要 解释 两 个 子 表达 式 ， 然 后 将 结果 的 闭 包 应 用 于 参数 。 不 过 ， 我 们 已 
经 说 好 了 ， 每 个 调用 都 需要 带 上 continuation 参 数 。 因 此， 必须 更 新 一 下 和 值 的 定义 : 


(define-type Value 
[numv (n : number)] 
[closv (f : (Value (Value -> Value) -> Value))]) 


接 下 来 必须 决定 传 给 它 啥 continuation。 对 于 函数 调用 ， 就 是 传 入 解释 器 的 continuation : 


<cps-interp-appC-case> ::= 
[appC (f a) (interp/k f env 
(lambda (fv) 
(interp/k a env 
(lambda (av) 
((closVv-f fv) av k)))))] 


最 后 处 理 lamC 的 情况 。 和 以 前 一 样 ， 我 们 必须 使 用 ambda 创 建 closV。 不 过 ， 这 个 函数 需要 
两 个 参数 : 实际 的 参数 和 调用 的 continuation。 关 键 的 问题 是 ， 后 者 该 是 什么 ? 


有 两 个 选择 。k 表 示 静 态 的 continuation : 在 闭 包 创建 位 置 的 那个 continuation。 不 过 ， 我 们 想 
要 的 是 在 闭 包 调用 之 处 的 continuation， 也 就 是 动态 的 continuation 。 


<cps-interp-lamC-case> ::= 


[lamC (a b) (k (closvV (lambda (arg-val dyn-k) 
(interp/k b 
(extend-env (bind a arg-val) 
env) 


dyn-k))))] 


要 测试 这 个 修改 后 的 解释 器 ， 我 们 需要 用 某 个 初始 continuation 调 用 interp/k。 这 个 子 程序 表示 
的 是 无 需 任 何其 他 计算 。 自 然 的 选择 是 恒 等 函 数 : 


(define (interp [expr : ExprCc]) : Value 
(interp/k expr mt-env 
(lambda (ans) 
ans))) 


为 了 强调 这 只 是 interp/k 的 顶层 接口 ，interp 放 弃 了 环境 参数 ， 自 动 传递 空 环境 给 interp/k。 如 
果 需 要 特别 确定 没有 意外 地 递归 使 用 这 个 函数 ， 我 们 可 以 在 其 最 后 插入 一 个 对 error 的 调用 ， 
以 防止 它 返回 ， 或 者 其 返回 值 被 使 用 。 


14.3 生成 器 


现在 许多 编程 语言 都 拥有 生成 器 〈generator) 这 一 概念 。 生 成 器 类 似 于 函数 ， 可 以 被 调用 。 

区 别 在 于 ， 常 规 函 数 总 是 从 头 开始 执行 ， 生 成 器 从 最 后 一 次 停止 的 地 方 恢 复 。 当 然 ， 这 意 
着 生成 器 需要 “在 完成 之 前 退出 "的 概念 。 这 就 是 所 谓 的 yield (让 位 ) ， 即 把 控制 权 归 还 给 调 
用 者 。 


14.3.1 各 种 设计 


生成 器 有 许多 不 同 的 变 体 。 可 以 想见 ， 不 同 之 处 在 于 如 何 进入 和 退出 生成 器 : 


。 在 某 些 语言 中 ， 生 成 器 是 一 种 对 象 ， 需 要 和 其 他 对 象 一 样 实例 化 ， 恢 复 其 执行 是 通过 调 
用 方法 (例如 Python 中 的 next) 。 在 其 他 语言 中 ， 生 成 器 则 类 似 于 函数 ， 而 且 重 入 是 通 
过 像 函 数 一 样 调用 。【 注 释 】 





。 在 某 些 语言 中 ， 让 位 操作 一 ”例如 Python 的 yield 一 只 能 在 生成 器 的 语法 主体 中 使 用 。 
在 其 他 语言 中 ， 例 如 Racket，yield 是 在 生成 器 主体 中 被 绑 定 的 、 可 调用 的 值 ， 正 由 于 它 
是 值 ， 它 可 以 被 抽象 的 传递 、 存 储 于 数据 结构 中 ， 等 等 。 


在 有 些 语言 中 ， 除 了 普通 的 函数 ， 其 他 值 也 可 以 用 做 调用 ， 所 有 这 些 值 被 统称 为 可 调用 
值 a ; 


Python 的 设计 代表 了 一 种 极端 ， 生 成 器 是 任何 包含 关键 字 yield 的 函数 。 此 外 ，Python 的 yield 
不 能 作为 参数 传递 给 另 一 个 函数 ， 由 该 函数 代理 来 执行 让 位 。 


还 有 个 关于 命名 的 小 问题 。 在 许多 支持 生成 器 的 语言 中 ， 让 位 指令 就 是 字面 上 的 yield : 要 人 么 
是 关键 字 (如 Python) ， 要 么 是 绑 定 为 可 调用 值 的 标识 符 ( 如 在 Racket 中 ) 。 还 有 种 可 能 

生成 器 的 用 户 必 须 在 生成 器 表达 式 中 指明 让 位 指令 的 名 字 。【 注 释 】 也 就 是 说 ， 生 成 器 是 这 
样 的 


>- 


(generator (yield) (from) 
(rec (f (lam (n) 


(seq 
(yield n) 
(f (+ n 1))))) 
(f from))) 


但 是 等 价 的 写法 


(generator (y) (from) 
(rec (f (lam (n) 
(seq 


(y n) 
(f (+ n 1))))) 
(f from))) 


如 果 这 个 让 位 指令 实际 上 是 值 ， 那 么 用 户 也 可 以 这 样 抽象 地 使 用 : 


(generator (y) (from) 
(rec (f (lam (n) 
(seq 
((yield-helper y) n) 


(f (+ n 1))))) 
(f from))) 


其 中 yield-helper 会 去 调用 让 位 指令 。 
实际 上 还 有 两 个 设计 上 的 决定 : 


1.， yield 是 声明 还 是 表达 式 ? 在 许多 语言 中 ， 它 是 表达 式 ， 这 意味 着 它 有 值 : 在 恢复 生成 器 
时 提供 的 值 。 这 使 得 生成 器 更 加 灵活 ， 因 为 生成 器 的 使 用 者 可 以 使 用 参数 来 改变 生成 器 
的 行为 ， 而 不 是 被 迫使 用 状态 来 传达 所 需 的 改变 。 

2. 生成 器 执行 结束 时 会 发 生 什 么 了 在 很 多 语言 中 ， 生 成 器 会 产生 蜡 常 来 表示 完成 。 


Wy 


凡 


奇怪 的 是 ，Python 在 对 象 中 期 望 用 户 来 确定 self 或 this 的 名 称 ， 但 是 它 没有 为 yield 提 供 相 
同 的 灵活 性 ， 因 为 这 是 唯一 确定 哪些 函数 是 生成 器 的 方式 ! 


14.3.2 实现 生成 器 


要 实现 生成 器 ， 有 效 的 方式 是 使 用 我 们 的 CPS 宏 语言 。 先 来 确定 这 个 设计 决定 的 意义 。 我 们 
用 调用 来 表示 生成 器 : 即 ， 要 获得 来 自生 成 器 的 下 一 个 值 ， 是 通过 将 其 应 用 于 任何 必要 的 参 
数 来 完成 的 。 类 似 的 ， 让 位 指令 也 是 可 调用 的 值 ， 并且 还 是 表达 式 。 虽 然 我 们 已 经 研究 过 宏 
如 何 自动 捕获 名 称 (译注 : 13.5 节 ) ， 但 是 简单 起 见 我 们 还 是 明确 给 出 让 位 指令 的 名 称 好 
了 。 最 后 ， 当 生成 器 执行 完成 时 ， 我 们 会 报错 。 


生成 器 如 何 工 作 ? 要 yield， 生 成 器 必须 


e。 记 住 它 现在 执行 到 哪里 ， 
e@ 知道 应 该 返回 到 调用 者 的 哪里 。 


而 当 生 成 器 被 调用 时 ， 它 应 该 


。 记 住 它 的 调用 者 执行 到 哪里 ， 
e 知道 它 应 该 返回 到 其 主体 内 的 哪里 。 


请 注意 调用 与 让 位 之 间 的 对 偶 。 
你 可 能 猜 到 了 ， 这 些 "哪里 "就 是 continuation 。 


我 们 来 逐步 实现 生成 器 ， 这 相当 于 添加 一 条 cps 宏 的 规则 。 先 写 下 模式 的 头 部 : 


<cps-macro-generator-case> ::= ;CPS 宏 ， 生 成 器 子 句 
[(_ (generator (yield) (v) b)) 


(and (identifier? #'v) (identifier? #'yield)) 
<generator-body>] ;生成 器 主体 


主体 第 一 部 分 很 简单 : CPS 中 的 所 有 代码 都 需要 先 读 入 continuation， 而 且 由 于 生成 器 是 值 ， 
所 以 这 个 值 要 被 传 给 continuation : 


<generator-body> ::= ;生成 器 主体 


#' (lambda (k) 
(k <generator-value>)) ;生成 器 的 值 


下 一 步 要 处 理 生成 器 的 核心 了 。 


回忆 一 下 ， 生 成 器 是 可 调用 的 值 。 这 就 是 说 ， 它 可 以 被 放 在 函数 调用 的 位 置 ， 因 此 它 必 须 具 
有 和 与 函数 相同 的 “接口 " : 函数 有 两 个 参数 ， 第 一 个 是 值 ， 第 二 个 是 调用 位 置 的 continuation 。 
这 个 子 程序 应 该 做 什么 ?我们 刚刚 描述 过 这 人 个。 首先， 生成 器 必须 记 住 它 的 调用 者 正在 执行 
的 地 方 ， 这 正 是 调用 位 置 的 continuation ;“ 记 住 ”这 里 最 简单 的 意思 是 “必须 保存 在 状态 中 。 然 
后 ， 生 成 器 应 该 返回 到 它 之 前 所 在 的 地 方 ， 即 它 自己 的 continuation， 这 个 显然 必须 被 保存 
过 。 因 此 ， 这 里 可 调用 值 的 核心 是 : 


<generator-core> ::= ;生成 器 的 核心 
(lambda (v dyn-k) 
(begin 


(set! where-to-go dyn-k) 
(resumer v))) 


这 里 ，Where-to-go 记 录 了 调用 者 的 continuation， 让 位 时 恢复 ; resumer 是 生成 器 的 本 地 
continuation。 让 我 们 考虑 一 下 它们 的 初始 值 是 什么 : 


。 Where-to-go 没 有 初始 值 (因为 生成 器 尚未 被 调用 ) ， 所 以 如 果 它 被 调用 ， 需 要 抛 出 错 
误 。 幸 运 的 是 ， 这 个 错误 永远 不 会 发 生 ， 因 为 第 一 次 进入 生成 器 时 会 对 Where-to-go 赋 
值 ， 所 以 这 个 错误 只 是 防范 实现 中 出 现 bug。 

。 最 初 ， 生 成 器 的 其 余部 分 是 整个 生成 器 ， 所 以 resumer 应 该 被 绑 定 到 b〈 的 CPS) 。 它 的 
continuation 是 什么 ?是 整个 生成 器 的 continuation， 即 当 生 成 器 结束 时 该 做 哈 。 我 们 已 经 


讨论 过 这 里 也 应 该 给 出 错误 (区 别 是 ? 在 这 种 情况 下 错误 确实 会 发 生 , 如 果 生 成 器 被 
要 求 产 生 比 它 配 备 的 更 多 的 值 ) 。 


还 需要 绑 定 yield。 正 如 我 们 已 经 指出 的 ， 它 对 称 于 生成 器 的 恢复 : 将 本 地 continuation 保 存在 
resumer 中 ， 然 后 通过 调用 Where-to-go 返 回 。 


把 这 些 片 段 放 到 一 起 ， 我 们 得 到 : 


<generator-value> ::= ;生成 器 的 值 


(let ([where-to-go (lambda (v) (error 'where-to-go "nothing"))]) 
(letrec([resumer (lambda (v) 
((cps b) (lambda (k) 
(error 'generator "fell through"))))] 
[yield (lambda (v gen-k) 
(begin 
(set! resumer gen-k) 
(where-to-go v)))]) 
<generator-core>)) 


为 什么 这 里 使 用 let 和 letrec， 而 不 只 用 let? 


请 注意 这 些 代码 片段 之 间 的 依赖 关系 。Wwhere-to-go 不 依赖 于 resumer 或 yield。yield 显 然 依赖 
于 where-to-go 和 resumer。 但 是 ， 为 什么 resumer 和 yield 相 互 引 用 呢 ? 


思考 题 
试 试 不 这 么 做 。 


你 可 能 会 遗漏 的 巧妙 依赖 是 ，resumer 中 包含 b， 生 成 器 的 主体 ， 它 可 能 包含 对 yield 的 引用 。 
因此 ， 它 需要 包含 退位 指令 的 绑 定 。 


练习 


生成 器 与 协 程 (coroutine) 和 线程 (thread) 有 什么 不 同 ? 了 使 用 类 似 的 策略 来 实现 协 程 
和 线程 。 


14.4 Continuation 和 堆栈 


虽然 看 上 去 不 明显 ， 但 是 CPS 转 换 实 际 上 对 程序 执行 的 栈 (译注 ， 调 用 栈 ) 本 质 提 供 了 深入 
的 了 解 。 首 先 要 理解 的 是 ，continuation 实 际 上 就 是 栈 本 身 。 这 可 能 看 起 来 很 奇怪 ， 因 为 堆栈 
是 底层 的 机 器 实现 ， 而 continuation 看 似 复杂 。 那 么 栈 到 斤 是 什么 呢 ? 


。 栈 是 还 有 待 完成 的 计算 的 记录 。continuation 也 是 。 

。 栈 传统 上 被 认为 是 栈 帧 (stack frame) 的 链表 。 也 就 是 说 ， 每 个 帧 都 引用 该 帧 完成 后 剩 
余 的 帧 。 类 似 地 ， 每 个 continuation 都 是 个 小 程序 ， 其 中 引用 因此 包含 一 一 自己 的 
continuation。 如 果 为 程序 指令 选择 不 同 的 表示 形式 ， 将 其 与 闭 包 的 数据 结构 表示 相 结 





合 ， 我 们 将 得 到 一 种 与 计算 机 堆栈 基本 相同 的 continuation 表 示 法 。 

。 每 个 栈 帧 中 还 存储 了 遂 数 的 参数 。continuation 的 子 程 序 表 示 法 隐 式 地 管理 了 此 项 信息 ， 
明确 地 由 数据 结构 Ce, 表示 。 

e 栈 帧 中 还 有 “局 部 变量 "的 空间 。continuation 原 则 上 也 是 如 此 ， 尽 管 我 们 使 用 宏 实 
绑 定 ， 因 此 相当 于 将 一 切 都 还 原 成 函数 和 参数。 然而 从 概念 上 讲 ， 其 中 一 些 是 “ 丨 实 的 ”函数 
参数 ， 而 另 一 些 是 通过 宏 变 成 函数 参数 的 局 部 绑 定 。 

。 栈 引 用 了 堆 ， 但 没有 内 含 堆 。 因 此 ， 堆 中 的 变化 在 不 同 的 栈 帧 都 是 可 见 的 。 同 样 地 ， 闭 

包 中 引用 了 贮存 ， 但 不 内 含 贮存 ， 所 以 对 贮存 的 修改 在 不 同 闭 包 中 都 是 可 见 的 。 


因此 ， 传 统 上 ， 栈 负责 维护 词法 范围 ， 而 我 们 使 用 (静态 范围 的 语言 中 的 ) 闭 包 自动 获得 此 
功能 。 


现在 我 们 可 以 研究 各 种 子 项 的 转换 ， 从 而 解 到 堆栈 的 映射 。 例 如 ， 考 虑 函数 应 用 的 转换 : 


[(- (f a)) 
#' (lambda (k) 
((cps f) (lambda (fv) 
((cps a) (lambda (av) 


(fv av k))))))] 


该 怎么 " 读 " 呢 ?这样 : 


e 我 们 用 k 表 示范 数 调用 之 前 的 栈 。 
。 在 对 沟 数 位 置 ( f ) 求 值 时 ， 创 建新 的 栈 帧 ( (1lambda (fv) ...) ) 。 该 帧 包含 一 个 自由 
标识 符 : k 。 因 此 ， 它 的 闭 包 需要 记录 环境 中 的 这 个 元 素 ， 即 栈 的 其 余部 分 。 
栈 帧 的 代码 部 分 表示 一 旦 我 们 获得 了 函数 的 值 ， 剩 下 的 工作 : 计算 参数 ， 执 行 调用 ， 将 
结果 返回 给 等 待 调用 结果 的 栈 : k。 
对 {f 的 求 值 完成 后 ， 对 a 求 值 ， 这 也 需要 创建 栈 帧 : (lambda (av) ...) 。 该 帧 有 两 个 自由 
标识 符 : k 和 fv。 这 说 明 : 
o 我 们 不 再 需要 对 函数 位 置 求 值 的 栈 帧 了 ， 但 是 
o 我 们 需要 用 临时 变量 记录 函数 位 置 求 值 的 结果 ， 它 最 好 是 函数 值 。 
e。 这 第 二 个 帧 的 代码 部 分 代表 也 是 剩 下 要 做 的 事情 : 对 参数 调用 函数 ， 在 等 待 调用 结果 的 
栈 中 进行 


条 件 指令 也 是 同样 的 推理 : 


[(_ (cnd tst thn els)) 
#' (lambda (k) 
((cps tst) (lambda (tstv) 
(If tstv 
((cps thn) k) 
((cps els) k)))))] 


它 说 的 是 ， 要 对 条 件 表 达 式 求 值 ， 我 们 先 要 创建 新 的 栈 帧 。 该 帧 中 包含 等 待 整个 条 件 表 达 式 
值 的 栈 。 该 帧 根据 条 件 表 达 式 的 值 来 决定 ， 调 用 其 子 表达 式 之 一 。 在 判断 了 条 件 的 值 之 后 ， 
为 了 求 它 的 值 而 创建 的 帧 就 不 再 需要 了 ， 因 此 求 值 可 以 在 Kk 中 继续 。 


从 这 个 角度 出 发 ， 我 们 可 以 更 好 的 解释 生成 器 的 操作 。 每 个 生成 器 都 有 自己 的 私有 栈 ， 当 执 
行 超越 其 栈 底 时 ， 我 们 的 实现 会 报错 。 被 调用 时 ， 生 成 器 将 表示 "剩余 程序 ”的 栈 的 引用 存储 在 

Where-to-go 中 ， 然 后 恢复 自己 的 栈 。 在 让 位 时 ， 系 统 交 换 扒 栈 的 引用 。 协 程 ， 线 程 和 生成 器 

在 概念 上 都 是 相似 的 : 它们 都 是 创建 “许多 小 堆栈 "的 机 制 ， 而 不 仅仅 只 是 单个 的 全 局 堆栈 。 


14.5 尾 调 用 


上 面 的 栈 模式 ， 为 当前 栈 添 加 帧 ， 执 行 一 些 计 算 ， 


观察 终 总 是 返回 到 当前 栈 。 特 别 要 注意 
的 是 ， 在 函数 调用 中 ， 0 a 
文 此 9 


旦 所 有 


是 返 
是 对 


不 需要 消耗 栈 空间 : 我 们 只 需要 空 e 间 来 计算 参数 


但 是 ， 并 非 所 有 的 语言 都 遵守 或 尊重 这 一 属性 。 在 这 样 做 的 语言 中 ， 程 序 员 可 以 使 用 递归 来 
获得 迭代 行为 : 即 ， 一 系列 函数 调用 不 会 比 没有 元 数 调用 的 情况 下 消耗 更 多 空间 。 这 消除 了 
创建 特殊 循环 结构 的 需要 ; 实际 上 ， 循 环 可 以 简单 地 表示 为 语法 糖 。 


当然 ， 这 个 属性 不 适用 于 一 般 情 况 。 如 果 调 用 f 来 计算 调用 g 所 需 的 参数 ， 那 么 对 {的 调用 相对 

于 围绕 g 的 上 下 文 仍然 会 占用 空间 。 因 此 ， 我 们 需要 说 明 表 达 式 之 间 的 关系 : 一 个 表达 式 的 处 
于 另 一 表达 式 的 尾 位 置 ， 如 果 对 它 的 求 值 不 需要 另 一 表达 式 ( 求 值 ) 之 外 的 额外 空间 。 在 我 

们 的 CPS 宏 中 ， 所 有 使 用 k 作 为 其 continuation 的 表达 式 一 一 例如 ， 在 所 有 子 表达 式 求 值 完成 

之 后 的 函数 调用 ， 或 者 条 件 表 达 式 的 then 和 else 分 支 一 一 都 在 其 外 层 表达 式 的 尾 位 置 (也 许 递 
归 地 还 在 其 外 层 的 尾 位 置 ) 。 反 之 ， 所 有 必须 创建 新 栈 帧 的 表达 式 都 不 在 尾 位 置 。 





有 些 语言 对 尾 递归 个 函数 在 其 函数 体 的 尾 位 置 调用 自己 一 一 有 特殊 的 支持 。 这 显然 是 

有 用 的 ， 因 为 字 使 得 过 得 以 有 效 地 实现 循环 。 然 而 ， 它 破坏 了 不 能 被 挤 入 单个 递归 函数 

的 “循环 "。 例 如 ， 当 实现 状态 机 时 ， 最 方便 的 方法 是 用 一 组 函数 ， 每 个 函数 代表 一 个 状态 ， 然 
过 ( 尾 ) 调用 表示 状态 转换 。 把 它们 变 成 单一 的 递归 函数 会 非常 繁 天 (并 且 失 去 了 意 

义 ) 。 但 是 ， 如 果 一 种 语言 能 够 识别 尾 调用 ， 它 就 可 以 《和 函数 内 调用 自己 一 样 ) 优化 这 些 

跨 函 数 的 调用 。 





Racket 的 实现 保证 尾 调用 不 会 分 配额 外 的 栈 空间 。 有 人 把 这 称 为 “ 尾 调 用 的 优化 "， 但 这 个 术语 
是 误导 性 的 : 优化 是 可 选 性 的 ， 而 某 种 语言 是 否 承 诺 正确 实现 尾 调用 是 种 语义 特性 。 程 序 员 
需要 了 解 语言 的 行为 方式 ， 因 为 这 会 影响 他 们 的 编程 方式 。 


由 于 这 个 特性 ， 观 察 CPS 转 换 之 后 的 程序 的 有 趣 之 处 : 其 中 所 有 的 函数 调用 本 身 都 是 尾 调用 
的 ! 从 本 章 开 头 的 read-numbersuspend 例 子 开始 ， 你 就 可 以 看 到 这 点 : 所 有 待 处 理 的 计算 都 

被 放 入 了 continuation 参 数 。 假 设 程序 可 能 在 任何 调用 中 终止 ， 等 同 于 根本 不 使 用 任何 栈 空间 
(因为 栈 将 会 被 清除 ) 。 


练习 


程序 如 何在 没有 栈 的 情况 下 运行 ? 


14.6 语言 特性 中 支持 continuation 


了 解 connection 和 栈 之 间 的 这 种 关联 之 后 ， 现 在 可 以 回 过 头 讨论 函数 的 处 理 : 我 们 忽略 了 在 创 
建 闭 包 时 的 continuation， 而 只 使 用 了 在 闭 包 调用 时 的 continuation。 当 然 ， 这 对 应 于 普通 的 元 
数 行为 。 但 现在 我 们 可 以 问 ， 如 果 我 们 用 创建 时 的 connection 呢 ?这 等 同 于 ， 在 “程序 "创建 时 
保存 对 栈 的 (副本 ) 的 引用 ， 然 后 在 调用 函数 时 忽略 动态 的 求 值 ， 返 回 到 函数 创建 点 。 


实际 上 ， 我 想 说 的 是 ， 让 lambda 保 持 不 变 ， 而 给 我 们 的 语言 提供 新 的 、 对 于 与 这 种 行为 的 指 


es， 


<cps-macro-let/cc-case> ::= ;cps 窑 


[(_ (let/cc kont b) ) 
(identifier? #'kont) 
#'(lambda (Kk) 
(let ([kont (lambda (v dyn-k) 
(k v))]) 
((cps b) k)))] 


这 说 的 是 ， 两 种 情况 下 ， 控 制 都 将 返回 到 直接 包含 let/cc 的 表达 式 : 要 么 通过 正常 返回 (因为 
主体 b 的 continuation 是 k) ， 要 么 通过 更 有 意思 的 方式 ， 调 用 continuation， 这 会 丢弃 动态 的 
continuation dyn/k， 简 单 地 忽略 它 直 接 返 回 到 K。 


最 简单 的 测试 是 : 
(test (run (cps (let/cc esc 3))) 
3) 
这 证 实 了 ， 如 果 我 们 从 不 使 用 continuation， 那 么 对 主体 的 求 值 就 好 像 let/cc 根 本 不 存在 一 样 
(因为 ((cps b) k) ) 。 如 果 我 们 使 用 它 ， 传 给 continuation 的 值 返回 到 创建 点 : 


(test (run (cps (let/cc esc (esc 3)))) 
3) 


当然 ， 这 个 例子 揭露 的 还 不 够 ， 不 过 考虑 这 个 


(test (run (cps (+ 1 (let/cc esc (esc 3) )))) 
4) 


这 证 实 了 加 法 会 实际 执行 。 那 么 动态 的 continuation 呢 ? 
(test (run (cps (let/cc esc (+ 2 (esc 3))))) 
3) 


这 表明 加 2 


不 会 
保留 ， 请 观察 : 


发 生 ， 即 动态 continuation 确 实 被 忽略 了 。 为 了 确保 创建 位 置 的 continuation 被 


(test (run (cps (+ 1 (let/cc esc (+ 2 (esc 3)))))) 
4) 


从 这 些 例子 中 ， 你 可 能 已 经 注意 到 熟悉 的 模式 : esc 在 这 里 的 表现 类 似 于 异常 。 也 就 是 说 ， 如 
果 你 不 抛 出 异常 (在 这 里 ， 调 用 continuation) 它 就 好 像 不 在 那里 ， 但 是 如 果 你 抛 出 异常 ， 所 
有 未 完成 的 中 间 计 算 都 将 被 忽略 ， 计 算 返 回 到 异常 创建 点 。 


练习 
使 用 let/cc 和 宏 实 现 异 常 的 抛 出 和 捕获 机 制 。 


然而 ， 这 些 例子 只 用 到 了 最 浅 层 的 (let/cc 的 ) 能 力 ， 因 为 这 里 调用 点 处 的 continuation 总 是 创 
建 点 处 的 continuation 的 扩展 : 即 后 者 在 栈 中 比 前 者 更 早 。 然 而 ， 没 有 任何 东西 要 求 k 和 dyn-k 
之 间 存 在 相关 。 它 们 实际 上 可 以 是 无 关 的 ， 这 意味 着 它们 可 以 是 两 个 独立 的 栈 ， 所 以 我 们 可 
以 用 它 轻松 地 实现 栈 切 换 功 能 。 


练习 
为 了 丨 正 与 laqmbda 类 似 ， 我 们 应 该 引入 如 下 展开 的 构造 ， 称 其 为 cont-lambda 好 了 : 


[( (cont-lambda (a) b)) 
(identifier? #'a) 
#'(lambda (k) 
(k (lambda (a dyn-k) 
((cps b) k))))] 


为 什么 我 们 没有 这 么 做 呢 ? 从 两 方面 考虑 ， 静 态 类 型 的 角度 ， 还 有 ， 我 们 如 何 使 用 这 个 
构造 来 构建 上 述 类 似 于 异常 的 行为 。 


14.6.1 用 语言 表达 


用 我 们 的 小 玩具 语言 编写 程序 很 快 会 变 得 令 人 注 菩 。 棕 运 的 是 ，Racket 已 经 提供 了 叫做 call/cc 
的 构造 ， 用 来 操作 continuation。call/cc 是 单 参数 的 函数 ， 其 参数 本 身 又 是 单 参 数 的 函数 ， 
Racket 会 将 当前 continuation 传 给 它 进行 调用 ， 而 当前 continuation 也 是 单 参数 的 子 程 序 。 能 理 
解 吗 ? 


幸运 的 是 ， 我 们 可 以 用 call/cc 轻 松 地 将 let/cc 实 现 为 宏 ， 然 后 用 它 来 编写 程序 。 这 样 : 


(define-syntax let/cc 
(syntax-rules () 
[(let/cc k b) 
(call/cc (lambda (k) b))])) 


之 前 的 所 有 测试 仍然 通过 : 


(test (let/cc esc 3) 3) 

(test (let/cc esc (esc 3)) 3) 

(test (+ 1 (let/cc esc (esc 3))) 4) 

(test (LetVcc esc (+ 2 (esc 3))) 3) 

(test (+ 1 (let/cc esc (+ 2 (esc 3)))) 4) 


14.6.2 定义 生成 器 


现在 我 们 可 以 创建 有 趣 的 抽象 了 。 比 如 ， 让 我 们 来 编写 生成 器 。 之 前 我 们 需要 将 表达 式 CPS 
转化 ， 并 传递 continuation， 现 在 都 可 以 通过 call/cc 自 动 完 成 。 因 此 ， 当 需要 目前 的 
continuation 时 ， 我 们 都 可 以 简单 地 召唤 它 而 无 需 改 变 程序 。 所 以 ， 额 外 的 ...,-k 参数 都 会 消 
失 ， 在 同一 个 地 方 可 以 用 let/cc 捕 获 相同 的 continuation : 


(define-syntax (generator e) 
(syntax-case e () 
[(generator (yield) (v) b) 
#'(let ([where-to-go (lambda (v) (error 'where-to-go "nothing"))]) 
(letrec ([resumer (lambda (v) 
(begin b 
(error 'generator "fell through")))] 
[yield (lambda (v) 
(let/cc gen-k 
(begin 
(set! resumer gen-k) 
(where-to-go v))))]) 
(lambda (v) 
(let/cc dyn-k 
(begin 
(set! where-to-go dyn-k) 
(resumer Vv))))))])) 


请 观察 这 段 代 码 和 去 语法 糖 到 CPS 代 码 实 现 的 生成 器 之 间 的 密切 相似 性 。 具 体 而 言 ， 我们 去 
掉 了 额外 的 continuation 参 数 ， 用 let/cc 调 用 替换 它们 ， 这 些 调用 能 捕获 完全 相同 的 
continuation 。 其 余 的 代码 基本 不 变 。 


练习 
如 果 我 们 将 (两 处 ) let/cc 和 赋值 移 到 begin 内 的 第 一 个 语句 ， 会 发 生 什 么 呢 ? 


例如 ， 我 们 可 以 编写 从 初始 值 向 上 和 迭代 的 生成 器 : 


(define g1 (generator (yield) (v) 
(letrec ([loop (lambda (n) 
(begin 
(yield n) 
(loop (+ n 1))))]) 
(loop v)))) 


> (g1 10) 
10 
> (g1 10) 
11 
> (g1 0) 
12 
> 


因为 (生成 器 ) 主体 只 引用 了 初始 值 ， 调 用 yield 所 返回 的 值 被 忽略 ， 所 以 在 后 续 调用 传 入 的 
值 不 起 作用 。 相 反 ， 考 虑 这 个 生成 器 : 
(define g2 (generator (yield) (v) 
(letrec ([loop (lambda (n) 


(loop (+ (yield n) n)))]) 
(loop v)))) 


在 第 一 次 调用 时 ， 它 返回 输入 的 值 。 在 此 后 的 调用 中 ， 该 值 被 加 到 后 续 调 用 生成 器 所 提供 的 
值 上 。 换 一 种 说 法 ， 该 发 生 器 累加 它 的 所 有 输入 值 : 


> (g2 10) 
10 
> (g2 15) 


现在 我 们 已 经 使 用 call/cc 和 |et/cc 实 现 了 生成 器 ， 请 用 它们 实现 协 程 和 线程 。 


14.6.3 定义 线程 
完成 生成 器 之 后 ， 我 们 再 做 个 类 似 的 功能 : 线程 。 上 有 具体 来 说 ， 我 们 希望 能 够 编写 如 下 的 程 
序 : 


(define d display) ; ;有 用 的 简写 
(Scheduler-1Loop-0 
(list 
(thread-0 (y) (d "t1-1 ") (y) (d "tl1-2 ") (y) (d "ti-3 ")) 


(thread-g (y) (d "t2-1 ") (y) (d "t2-2 ") (y) (d "t2-3 ")) 
(thread-g (y) (d "t3-1 ") (y) (d "t3-2 ") (y) (d "t3-3 ")))) 


输出 应 该 是 
E1510 C2 7 £0170 1202 2 tt tt 


我 们 来 创建 必要 的 组 件 实现 此 功能 。 


我 们 先 来 定义 线程 调度 器 。 它 读 入 “线程 "的 链表 ， 我 们 假设 线程 的 接口 读 入 continuation， 并 
最 终 将 控制 返回 给 此 continuation。 每 当 调 度 器 重新 激活 某 个 线程 时 ， 都 会 向 其 提供 
continuation。 调 度 器 可 以 用 简单 的 循环 (round-robin) 方式 选择 线程 ， 也 可 以 使 用 更 复杂 的 
算法 ; 这 里 我 们 不 关心 如 何 选择 的 细节 。 


类 似 于 生成 器 ， 我 们 假定 让 位 由 调用 用 户 命名 的 子 程序 完成 ， 例 如 这 里 的 y。 我 们 也 可 以 使 用 
名 称 捕获 (译注 ，13.5 节 ) 自动 绑 定 其 名 称 ， 比 如 yield。 


这 里 的 要 点 的 是 ， 请 注意 让 位 由 线程 系统 的 用 户 手动 控制 。 这 就 是 所 谓 的 协作 式 多 任务 处 理 

(cooperative multitasking) 。 相 反 ， 我 们 可 以 选择 通过 生成 定时 器 或 其 他 内 在 机 制 自动 触发 
让 位 ， 而 无 需 用 户 许可 。 这 被 称 为 抢占 式 多 任务 处 理 (preemptive multitasking) (因为 系统 
从 线程 中 “抢占 ”一 一 也 就 是 夺取 了 控制 权 ) 。 虽 然 这 种 区 别 对 于 构建 系统 来 说 是 非常 重要 
的 ， 但 从 设置 continuation 的 角度 来 看 ， 这 并 不 重要 。 





练习 
在 完成 协作 式 多 任务 之 后 ， 实 现 抢 占 式 多 任务 。 哪 里 需要 修改 ? 


陈述 了 这 些 限 制 ， 我 们 可 以 着 手 编写 调度 器 了 。 它 读 入 线程 的 链表 ， 只 要 还 有 剩 下 的 线程 就 
继续 执行 。 每 次 ， 它 将 线程 应 用 于 continuation， 这 个 continuation 表 示 返 回 到 调度 器 并 继续 下 
一 个 线程 : 


(define (Scheduler-loop-0 threads ) 
(cond 

[(empty? threads) 'donel] 

[(cons? threads) 

(begin 
(let/cc after-thread ((first threads) after-thread)) 
(scheduler-loop-0 (append (rest threads) 

(list (first threads)))))])) 


当 接 收 线程 调用 绑 定 到 after-thread 的 continuation 时 ， 控 制 返回 到 begin 序 列 中 第 一 个 语句 的 
结尾 。 因 此 ， 提 供给 continuation 的 值 会 被 忽略 〈 所 以 可 以 用 任何 值 ; 我 们 选择 用 'dummy ， 
以 便 其 英名 出 现时 方便 地 发 现 问题 ) 。 将 最 近 调 用 的 线程 附加 到 线程 表 的 末尾 〈 即 ， 将 该 链 
表 视 为 循环 队列 ) 之 后 ， 控 制 将 继续 调度 器 循环 的 其 余部 分 。 


接 下 来 我 们 定义 线程 。 我 们 说 过 ， 它 是 单 参 数 的 函数 ， 参 数 就 是 调度 器 的 continuation。 由 于 
线程 需要 能 恢复 ， 也 就 是 从 停止 的 地 方 继续 ， 所 以 它 必 须 存 储 上 次 执行 到 的 位 置 : 我 们 将 其 
称 为 thread-resumer 。 起 初 thread-resumer 是 整个 线程 体 ， 但 在 后 续 的 实例 中 ， 它 将 是 
continuation : 调用 yield 的 continuation。 于 是 ， 我 们 得 到 如 下 的 框架 : 


(define-syntax thread-0 
(syntax-rules () 
[(thread (yielder) b ...) 
(letrec ([thread-resumer (lambda (_) 
(begin b ...))]) 
(lambda (sched-k) 
(thread-resumer 'dummy)))])) 


还 剩 下 yielder 没 实现 。 它 是 无 参数 的 函数 ， 将 线程 的 continuation 存 入 thread-resumer ， 然 后 
用 'dummy 调用 调度 器 的 continuation。 不 过 ， 调 用 哪个 调度 器 的 continuation 呢 ? 不 是 线程 初 
始 化 时 传 入 的 那个 ， 而 是 最 新 的 那个 。 因 此 ， 我 们 必须 以 某 种 方式 将 sched-k 中 的 

值 “thread”( 译 注 ， 传 递 ) 给 yielder 。 do) 以 实现 ， 但 最 简单 的 ， 也 许 是 最 暴力 的 
方式 是 ， 简 单 地 为 每 个 线程 恢复 重建 yielder， 总 是 包含 sched-k 的 最 新 值 : 


(define-syntax thread-0 
(syntax-rules () 
[(thread (yielder) b ...) 
(letrec ([thread-resumer (lambda (_) 
(begin b ...))] 
[yielder (lambda () (error 'yielder "nothing here"))]) 
(lambda (sched-k) 
(begin 
(set! yielder 
(lambda () 
(let/cc thread-k 
(begin 
(set! thread-resumer thread-k) 
(sched-k 'dummy))))) 
(thread-resumer 'tres))))])) 


将 这 些 放 到 一 起 运行 ， 我 们 得 到 : 


El 2 22 2 E3329 S20 953 


嘿 ， 这 就 是 我 们 想 要 的 |! 但 是 运行 继续 : 


t1-3 t2-3 t3-3 t1-3 t2-3 t3-3 tl-3 t2-3 t3-3 


怎么 回 事 ? 恩 ， 我 们 并 没有 说 明 当 线程 运行 结束 时 需要 怎么 处 理 。 实 际 上 ， 控 制 只 是 返回 到 
用 庆 度 器 ， 调 度 器 将 线程 追加 到 队列 的 末尾 ， 然 后 ， 当 线程 再 次 到 达 队 列 的 头 部 时 ， 控 制 
从 之 前 存储 的 那个 continuation 中 恢复 : 对 应 于 打印 第 三 个 值 。 打 印 ， 控 制 返回 ， 线 程 被 追加 
到 队 尾 ...... 无 限 循 环 。 


显然 ， 在 线程 终止 时 ， 我 们 需要 通知 线程 调度 器 ， 这 样 调度 器 可 以 将 其 从 线程 队列 中 移 除 。 
我 们 创建 简单 的 数据 类 型 来 表示 该 信号 : 


(define-type ThreadStatus 
[Tsuspended] 
[Tdone]) 


(当然 ， 的 系统 中 ， 这 些 状态 消息 也 可 以 带 上 和 计算 相关 的 值 。) 那么 我 们 必须 修改 
调度 器 ， 实 际 检查 和 使 用 这 些 


些 状 
值 : 


(define (scheduler-loop-1 threads ) 
(cond 

[(empty? threads) 'donel] 

[(cons? threads) 

(type-case ThreadStatus (let/cc after-thread ((first threads) after-thread)) 
[Tsuspended () (scheduler-loop-1 (append (rest threads) 

(list (first threads))))] 

[Tdone () (scheduler-loop-1 (rest threads))])])) 


线程 的 表示 中 有 两 个 地 方 需要 修改 : 中 间 返 回 的 时 候 它 必须 传 Tsuspended 给 调度 器 的 
continuation， 终 止 时 传 Tdone。 哪 里 是 终止 呢 ? 在 执行 完 线程 体 代 码 b ... 之 后 
注意 和 退位 一 样 ， 终 止 程序 必须 也 使 用 最 新 的 调度 器 continuation。 因 而 : 


oo 


最 后 ， 请 


(define-syntax thread-1 
(syntax-rules () 
[(thread (yielder) b ...) 
(letrec ([thread-resumer (lambda (_) 
(begin b ... 
(finisher)))] 
[finisher (lambda () (error 'finisher "nothing here"))] 
[yielder (lambda () (error 'yielder "nothing here"))]) 
(lambda (sched-k) 
(begin 
(set! finisher 
(lambda () 
(let/cc thread-k 

(sched-k (Tdone))))) 

(set! yielder 
(lambda () 
(let/cc thread-k 
(begin 
(set! thread-resumer thread-k) 
(sched-k (Tsuspended)))))) 
(thread-resumer 'tres))))])) 


用 scheduler-loop-1 和 thread-1 替 换 scheduler-loop-0 和 thread-0， 重 新 运行 前 面 的 示例 程序 ， 
就 能 得 到 正确 的 输出 。 


14.6.4 更 好 的 Web 编 程 指令 


最 后 ， 我 们 回 过 头 看 看 read-number : 请 注意 ， 如 果 运 行 服务 器 程序 的 语言 有 call/cc， 我 们 就 
不 必 CPS 整 个 程序 ， 而 是 可 以 简单 地 捕获 当前 continuation， 将 其 保存 在 哈 希 表 中 ， 从 而 使 程 
序 结构 保持 不 变 。 


15 静态 地 检查 程序 中 的 不 变量 : 类 型 


当 程 序 变 得 更 大 或 者 更 为 复杂 时 ， 程 序 员 希 望 能 有 工具 帮助 他 们 描述 、 验 证 程序 中 的 不 变 

量 。 顾 名 思 义 ， 不 变量 指 的 就 是 关于 程序 组 成 元 素 的 那些 不 会 发 生 改 变 的 陈述 。 例 如 ， 当 我 

们 在 静态 类 型 语言 中 写 下 x : number 时 ， 表 示 X 中 存放 的 总 是 数 ， 程 序 中 依赖 X 的 部 分 都 可 
以 认定 它 是 数 的 这 个 事实 不 会 改变 。 我 们 将 会 看 到 ， 类 型 只 是 我 们 想 要 陈述 的 各 类 不 变量 中 

的 一 种 ， 静 态 类 型 检测 一 个 分 支 众多 的 技术 家 族 一 一 也 只 是 用 于 控制 不 变量 的 众多 方法 

中 的 一 个 。 





15.1 静态 类 型 规则 


本 章 我 们 将 专注 于 静态 类 型 检查 : 即 在 程序 执行 前 检查 (声明 的 ) 类 型 。 之 前 使 用 的 静态 类 
型 语言 已 经 让 我 们 积攒 了 一 些 这 种 形式 程序 的 经 验 。 我 们 将 探索 类 型 的 设计 空间 及 这 些 设 计 
中 的 权衡 取舍 。 尽 管 类 型 是 控制 不 变量 的 一 种 非常 强大 且 有 效 的 方法 ， 最 后 我 们 还 是 会 考察 
一 些 其 它 可 用 的 技术 。 


考虑 下 面 这 段 静态 语言 写 就 的 程序 : 


(define (f [n : number]) : number 
(+ n 3)) 


(f We) 
程序 开始 执行 前 我 们 就 会 得 到 一 个 静态 类 型 错误 。 使 用 普通 Racket 写 就 的 同样 的 程序 (去除 
类 型 注解 ) 只 会 在 运行 时 出 错 : 

(define (f n) 

(+ n 3)) 

(f XS) 
练习 是 

如 何 判断 错误 是 在 程序 执行 前 还 是 运行 时 抛 出 的 ? 


考虑 下 面 这 段 Racket 程序 : 


(define f n 
(+ n 3)) 


它 也 是 在 程序 执行 前 就 遇 到 错误 一 语法 解析 错误 终止。 尽管 我 们 认为 语法 解析 和 类 型 
检查 有 所 不 同一 一通 常 是 因为 类 型 检测 是 针对 已 经 被 解析 好 的 程序 做 的 一 但 是 将 语法 解析 
看 作 一 种 最 简单 形式 的 类 型 检查 也 很 有 用 : 它 (静态 地 ) 判定 程序 是 否 遵 守 某 个 上 下 文 无 关 











语法 。 随 后 ， 类 型 检查 判定 它 是 否 遵守 某 个 上 下 文 相关 (或 者 一 个 更 丰富 的 ) 语法 。 简 而 言 
之 ， 类 型 检查 从 某 种 程度 上 看 是 语法 解析 的 泛 化 ， 它 们 都 是 通过 语法 控制 程序 遵循 指定 的 规 


15.2 关于 类 型 的 经 典 看 法 


我 们 先 介绍 传统 的 包含 类 型 的 核心 语言 ; 然后 我 们 将 探索 其 扩展 和 变种 。 


15.2.1 简单 的 类 型 检查 器 


要 定义 类 型 检查 器 ， 我 们 先 需要 就 两 件 事 达 成 一 致 : 我 们 静态 类 型 核心 语言 的 语法 ， 对 应 的 
ee 


先 回 到 我 们 之 前 实现 过 的 函数 作为 值 的 那 一 版 语言 ， 其 中 并 不 包含 赋值 等 其 它 稍 复杂 的 东西 
(后 面 将 讲 到 添加 其 中 的 一 些 ) 。 我 们 需要 为 该 语言 添加 类 型 注解 。 按 惯例 ， 我 们 不 对 常量 
或 基本 操作 (如 加 法 ) 强加 类 型 注释 ; 相反 ， 我 们 把 类 型 注释 加 在 函数 或 方法 的 边界 上 。 在 
本 章 讨 论 的 过 程 中 ， 我 们 将 探讨 为 什么 这 么 做 。 


监 于 此 决定 ， 我 们 静态 类 型 的 核心 语言 变 成 了 : 


(define-type TyEXxprC 
[numC (n : number)] 
[idc (s : symbol)] 
[appC (fun : TyExprC) (arg : TyExprcC)] 
[plusC (1 : TyExprC) (r : TyExprc)] 
[multCc (1 : TyExprc) (r : TyExprc)] 
[lamC (arg : Symbol) (argT : Type) (retT : Type) (body : TyExprcC)]) 


每 个 函数 都 添加 了 其 参数 及 返回 值 类 型 的 注解 。 


现在 我 们 需要 对 类 型 语言 作出 选择 。 我 们 遵从 传统 定义 ， 即 类 型 是 一 组 值 的 集合 的 抽象 。 我 
们 的 语言 中 有 两 类 值 : 


(define-type Value 
[numv (n : number)] 
[closv (arg : Symbol) (body : TyExprc) (env : Env)]) 


因此 我 们 有 两 种 类 型 : 数 和 部 数 。 


即使 数 类 型 也 并 不 那么 简单 直接 : 数 类 型 应 该 记录 何 种 信息 ? 大 部 分 语言 中 ， 实 际 上 有 很 多 
数 类 型 ， 甚 至 没有 哪个 类 型 表示 * 数 "。 然 而 ， 我 们 忽略 了 数 的 层级 结构 (译注 ， 第 三 章 ) ， 对 
于 我 们 来 说 有 一 种 数 的 类 型 足 矣 。 这 样 决定 之 后 ， 我 们 是 否 需要 记录 哪 种 数 的 信息 ? 原则 上 
可 以 ， 但 这 样 我 们 很 快 就 会 遇 到 可 判定 性 问题 。 


至 于 函数 ， 我 们 有 更 多 信息 : 参数 的 类 型 ， 返 回 值 的 类 型 。 我 们 不 妨 记 录 下 这 些 信息 ， 除 非 
事后 证 实 这 些 信息 没有 用 处 。 结 合 这 些 ， 我 们 得 出 这 样 的 类 型 的 抽象 语言 : 


(define-type Type 
[numT] 
[funT (arg : Type) (ret : Type)]) 


Ry ee Tt nk ei 型 错误 (并 
且 ， 如 果 程 序 中 不 包含 这 里 列 出 的 类 型 错误 ， 它 就 会 通过 类 型 检查 ) 。 显 然 有 三 种 形式 的 类 


型 错误 : 


e。 + 的 参数 不 是 数 ， 即 不 是 numT 。 
e * 的 参数 不 是 数 。 
。 函数 调用 时 函数 位 置 的 表达 式 不 是 函数 ， 即 不 是 funT 。 


思考 是 

还 有 其 它 形式 的 类 型 错误 吗 ? 
事实 上 我 们 遗漏 了 一 个 : 

。 函数 调用 时 实 参 的 类 型 和 函数 形 参 的 类 型 不 一 致 
我 们 的 语言 中 的 所 有 其 他 程序 似乎 都 应 该 通过 类 型 检查 。 


关于 类 型 检查 器 的 签名 ， 初 步 设想 ， 它 可 以 接受 表达 式 作为 参数 ， 返 回 布尔 值 指明 该 表达 式 
是 否 通 过 检查 。 No er 包含 标识 符 ， 所 以 很 显然 我 们 还 需要 一 个 类 型 环境 ， 
它 将 名 字 映 射 到 类 型 ， 类 似 于 我 们 之 前 用 到 的 值 环境 。 


练习 题 
定义 与 类 型 环境 相关 的 数据 类 型 以 及 函数 。 


于 是 ， 我 们 开始 写 下 的 程序 结构 大 致 是 这 样 : 


<tc-take-1> ::= )) 类 型 检查 ， 第 一 次 尝试 
(define (tc [expr : TyExprCc] [tenv : TyEnv]) : boolean 
(type-case TyExprC expr 
<tc-take-1-numC-case> 
<tc-take-1-idC-case> 
<tc-take-1-appC-case>)) 


正如 上 面 程序 中 列 出 的 要 处 理 几 种 情形 所 表明 的 ， 这 种 方法 行 不 通 。 我 们 很 快 将 知道 这 是 为 
什么 


首先 处 理 简单 的 情形 : 数 。 单 独 的 一 个 数 能 通过 类 型 检查 吗 ? 显然 可 以 ; 它 所 处 的 上 下 文 可 
能 想 要 的 不 是 数 类 型 ， 但 是 这 种 错误 应 该 在 其 它 地 方 被 检查 出 。 因 此 : 


<tc-take-1-numC-case> : := 


[numC (n) true] 


下 面 处 理 标识 符 。 如 何 判断 标识 符 是 
标识 符 ， 总 是 通过 检查 的 ; 它 可 能 
方 检查 。 因 此 ， 我 们 得 出 : 


上 下 文 要 求 的 那 种 类 型 ， 但 是 这 种 错误 应 该 在 其 它 地 


昼 
各 动 


<tc-take-1-idC-case> : := 
[idc (n) (if (lookup n tenv) 


true 
(error 'tc "not a bound identifier"))] ;不 是 绑 定 标识 符 


上 面 的 代码 你 可 能 感觉 不 太 对 : 如 果 标 识 符 未 绑 定 的 话 ， lookup 会 抛 出 异常 ， 因 此 没 必 要 再 
去 重复 处 理 该 情况 (事实 上 ， 代 码 永远 不 会 执行 到 error 调用 那个 分 支 ) 。 但 是 让 我 们 先 继 


二 
续 。 


下 面 来 处 理 函 数 调用 。 我 们 应 该 首先 检查 函数 位 置 ， 确 定 它 是 个 函数 ， 然 后 确保 实际 参数 的 
类 型 和 该 函数 定义 时 声明 的 形式 参数 类 型 相同 。 例 如 ， 函 数 可 能 需要 参数 是 数 ， 但 调用 给 的 
是 个 函数 ， 或 者 反之 ， 在 这 两 种 情况 下 ， 我 们 都 需要 防止 错误 的 子 数 调用 。 


代码 该 怎么 写 ? 


<tc-take-1-appC-case> ::= 


[appC (f a) (let ([ft (tc f tenv)]) 
wn) | 


对 于 tc 的 递归 调用 只 能 让 我 们 知道 函数 位 置 是 否 通 过 类 型 检查 。 如 果 它 通过 了 ， 怎 么 知道 它 
具体 是 什么 类 型 的 呢 ?如 果 是 个 简单 的 函数 定义 的 话 ， 我 们 可 以 直接 从 语法 上 取得 其 参数 和 
返回 值 的 类 型 。 但 是 如 果 是 个 复杂 的 表达 式 ， 我 们 就 需要 一 个 函数 能 计算 出 表达 式 类 型 。 当 
然 ， 只 有 这 个 表达 式 是 个 类 型 正确 的 表达 式 时 ， 该 函数 才能 返回 类 型 结果 ; 否则 的 话 它 将 不 
能 得 出 正确 的 结果 。 换 名 话说 ，“ 类 型 检查 ”是 “类 型 计算 ”的 一 种 特殊 情形 ! 因此 ， 我 们 应 该 
增强 tc 的 归纳 不 变量 : 即 ， 不 仅仅 返回 表达 式 是 否 能 通过 类 型 检查 ， 而 是 返回 表达 式 的 类 
型 。 事 实 上 ， 只 要 有 返回 值 ， 就 说 明 该 表达 式 通过 了 类 型 检查 ; 否则 它 会 抛 出 错误 。 


下 面 我 们 来 定义 这 个 更 完善 的 类 型 “检查 器 ”。 


<tc> ::= 


(define (tc [expr : TyExprC] [tenv : TyEnv]) : Type 
(type-case TyExprC expr 
<tc-numC-case> 
<tc-idC-case> 
<tc-plusC-case> 
<tc-multC-case> 
<tc-appC-case> 
<tc-lamC-case>)) 


现在 填充 具体 实现 。 数 很 简单 : 它 的 类 型 就 是 数 类 型 。 


<tc-numC-case> : := 


[numC (Nn) (numT)] 


与 之 相似 ， 标 识 符 的 类 型 从 环境 中 查询 得 到 (如 果 其 未 被 绑 定 则 会 抛 出 错误 ) 。 


<tc-idC-case> ::= 


[idc (n) (lookup n tenv)] 


到 此 ， 我 们 可 以 观察 到 该 类 型 检查 器 与 解释 器 之 间 的 一 些 异 同 : 对 于 标识 符 ， 两 者 做 的 事情 
其 实 一 样 (只 不 过 这 里 返回 的 是 标识 符 的 类 型 而 不 是 一 个 实际 的 值 ) ， 对 于 数 的 情况 ， 这 里 
返回 了 抽象 的 “ 数 ” 而 不 是 具体 的 数 。 


下 面 考虑 加 法 。 必 须 确保 其 两 个 子 表达 式 都 具有 数 类 型 ; 如 果 满 足 该 条 件 ， 则 加 法 表达 式 本 
身 返回 的 是 数 类 型 。 


<tc-plusC-case> ::= 
[plusC (1 r) (let ([Lt (tc 1 tenv)] 
[rt (tc r tenv)]) 
(if (and (equal? 1t (numT)) 
(equal? rt (numT))) 


(numT) 
(error 'tc "+ not both numbers")))] ;+ 不 都 是 数 


通常 在 处 理 完 加 法 的 情形 之 后 ， 对 于 乘法 我 们 就 一 笔 带 过 了 ， 但 是 这 里 显 式 处 理 一 下 它 还 是 
很 有 教 益 的 : 


<tc-multC-case> ::= 
[multCc (1 r) (let ([Lt (tc 1 tenv)] 
[rt (tc r tenv)]) 
(if (and (equal? lt (numT)) 
(equal? rt (numT))) 


(numT) 
(error 'tc "* not both numbers")))] ;* 不 都 是 数 


思考 是 
看 出 其 中 的 区 别 了 吗 ? 

是 的 ， 基 本 上 完全 没 区 别 ! ( 仅 有 的 区 别 是 在 type-case 时 使 用 的 分 别 multc 和 plusc ， 以 
及 错误 提示 信息 稍 有 不 同 ) 。 这 是 因为 ， 从 (此 静态 类 型 语言 ) 类 型 检查 的 角度 来 说 ， 加 法 
和 乘法 没有 区 别 ， 更 其 ， 任 意 接受 两 个 数 作为 参数 返回 一 个 数 的 函数 都 没有 区 别 。 

注意 到 代码 解释 和 类 型 检查 之 间 另 一 个 不 同 点 。 它 们 的 参数 都 得 是 数 。 解 释 器 返回 加 或 者 乘 
它们 得 到 的 确切 数值 ， 但 是 类 型 检查 器 并 不 在 乎 具体 的 数值 : 因此 该 表达 式 的 计算 结果 

( (numT) ) 是 个 常数 2 两 种 情形 返回 都 是 该 常数 > 


最 后 还 剩 下 两 个 难 一 点 的 情形 : 函数 调用 和 函数 。 我 们 已 经 讨论 过 怎么 处 理 函 数 调 用 : 计算 
函数 以 及 参数 表达 式 的 值 ; 确保 函数 表达 式 为 函数 类 型 ; 检查 参数 类 型 和 函数 形 参 类 型 相 
容 。 如 果 这 些 条 件 满足 ， 函 数 调 用 得 到 的 结果 类 型 就 是 函数 体 的 类 型 (因为 运行 时 最 终 的 返 
回 值 就 是 计算 函数 体 得 到 的 值 ) 。 


<tc-appC-case> : := 


[appC (f a) (let ([ft (tc f tenv)] 
[at (tc a tenv)]) 
(cond 
[(not (funT? ft)) 
(error 'tc "not a function")] ;不 是 函数 
[(not (equal? (funT-arg ft) at)) 
(error 'tc "app arg mismatch")] ;app 参 数 不 匹 配 
[else (funT-ret ft)]))] 


最 后 还 剩 下 函数 定义 。 函 数 有 一 个 形 参 ， 函 数 体 中 一 般 会 用 到 ; 除非 它 被 绑 定 到 环境 中 ， 不 
然 函 数 体 应 该 不 太 可 能 通过 类 型 检查 。 因 此 我 们 需要 扩展 类 型 环境 ， 添 加 形 参 与 其 类 型 的 绑 
定 ， 然 后 在 扩展 后 的 环境 中 检查 函数 体 。 最 终 计算 得 到 的 函数 体 类 型 必须 和 郊 数 定义 中 指定 
的 函数 返回 值 类 型 相同 。 如 果 满 足 了 这 些 ， 该 函数 的 类 型 就 是 指定 参数 类 型 到 函数 体 类 型 的 
函数 。 


练习 题 
上 面 说 的 “不 太 可 能 通过 类 型 检查 "是 什么 意思 ? 


<tc-lamC-case> ::= 
[lamC (a argT retT b) 
(if (equal? (tc b (extend-ty-env (bind a argT) tenv)) retT) 


(funT argT retT) 
(error 'tc "lam type mismatch"))] ;入 类 型 不 匹配 


ee 
的 值 ， 扩 展 环境 ， 然 后 对 函数 体 求 值 。 而 这 里 ， 函 数 调 用 的 情形 中 的 确 也 检查 了 参数 表达 
式 ， 但 是 没有 涉及 到 环境 的 处 理 ， 本 回 了 了 类 型 ， 而 没有 遍历 它 。 对 函数 体 的 遍 
历 检 查 过 程 实际 是 在 检查 函数 定义 的 过 程 中 进行 的 ， 因 此 环境 也 是 在 这 个 地 方才 实际 被 扩展 
的 。 


15.2.2 条 件 语句 的 类 型 检查 


考虑 为 上 面 的 语言 滚 加 条 件 语句 ， 即 使 最 简单 的 计 表达 式 都 会 引入 若干 设计 抉择 。 这 里 我 们 
先 讨论 其 中 的 两 个 ， 后 面 会 回 过 头 讨论 其 中 的 一 个 。 


1. 条 件 表达 式 的 类 型 应 该 是 什么 ?了 茶 些 语言 中 它 
我 们 的 语言 添加 布尔 值 类 型 (这 可 能 是 个 好 主意 ) 。 其 它 语言 中 ， 它 避 
些 值 被 认为 是 “站 值 "， 其 它 的 则 被 视 为 “ 假 值 ”。 

2. then- 和 else- 两 个 分 支 之 间 的 关系 应 该 是 什么 呢 ? 一 些 语言 中 它们 的 类 型 必须 相同 ， 


因此 整个 让 表达 式 有 一 个 确定 无 歧义 的 类 型 。 其 它 语言 中 ， 两 个 分 支 可 以 有 不 同 的 类 
型 ， 这 极 大 地 改变 了 静态 类 型 语言 的 设计 和 它 的 类 型 检查 器 ， 而 且 也 改变 了 编程 语言 本 
身 的 性 质 。 


练习 题 
为 该 静态 类 型 语言 添加 布尔 值 。 至 少 需 要 添加 些 哈 ?在 典型 的 语言 中 还 需要 加 什么 ? 
练习 题 


为 条 件 语句 添加 类 型 规则 ， 其 中 条 件 表 达 式 应 该 计算 得 到 布尔 值 ， 且 then- 和 else- 分 
支 必 须 有 相同 的 类 型 ， 同 时 该 类 型 也 是 整个 条 件 语 多 的 类 型 。 


15.2.3 代码 中 的 递归 


现在 我 们 已 经 得 到 了 基本 的 编程 语言 ， 下 面 为 其 添加 递归 。 之 前 我 们 实现 过 递归 ， 可 以 很 容 
易 的 通过 去 语法 糖 实 现 。 这 里 的 情况 要 更 复杂 一 些 。 


15.2.3.1 递归 的 类 型 ， 初 次 尝试 


首先 尝试 表示 一 个 简单 的 递归 函数 。 最 简单 的 当然 就 是 无 限 循环 。 我 们 可 以 仅 使 用 函数 实现 
无 限 循环 吗 ? 可 以 : 


((lambda (x) (x x)) 
(lambda (x) (x x))) 


因为 我 们 的 语言 中 已 经 支持 将 函数 作为 值 。 
练习 题 
为 什么 这 会 构成 无 限 循 环 ? 它 是 如 何 巧妙 地 依赖 于 函数 调用 的 本 质 的 ? 


现在 我 们 的 静态 类 型 语言 要 求 我 们 为 所 有 函数 添加 类 型 注解 。 我 们 来 为 该 函数 添加 类 型 注 
解 。 简 单 起 见 ， 假 设 从 现在 开始 我 们 写 的 程序 使 用 的 语法 是 静态 类 型 的 表层 语法 ， 去 语法 糖 
将 帮 我 们 将 其 转换 为 核心 语言 。 


首先 注意 到 ， 我 们 有 两 个 完全 一 样 的 表达 式 ， 它 们 互相 调用 。 历 史 原 因 ， 整 个 表达 式 被 称 为 
Q (希腊 字母 大 写 欧米 药 ) ， 那 两 个 一 样 的 子 表达 式 被 称 为 WW (希腊 字母 小 写 欧米 萝 ) 。 两 个 
一 样 的 表达 式 并 非得 是 同 种 类 型 的 ， 因 为 这 还 依赖 于 具体 使 用 环境 中 对 于 不 变量 的 定义 。 这 
个 例子 中 ， 观 察 到 x 被 绑 定 到 w， 于 是 由 将 出 现在 在 (x x) 式 子 的 第 一 个 和 第 二 个 部 分 。 即 ， 
确定 其 中 一 个 表达 式 的 类 型 ， 另 一 个 式 子 的 类 型 也 被 确定 。 


那么 我 们 就 来 尝试 计算 w 的 类 型 ; 称 该 类 型 为 y。 显 然 它 是 一 个 函数 类 型 ， 而 且 是 单 参数 的 函 
数 ， 所 以 它 的 类 型 必然 是 -> y 这 种 形式 的 。 该 函数 的 参数 是 什么 类 型 ? 就 是 Ww 的 类 型 。 也 
即 ， 传 入 gp 的 值 的 类 型 就 是 y。 因 此 ，ww 的 类 型 是 y， 也 即 g -> 山 ， 展 开 即 (8 -> yg) -> 由， 进 


一 步 展开 得 ((@ -> 由 -> 由 -> 中， 还 可 以 继续 下 去 。 也 就 是 说 ， 该 类 型 不 能 用 有 限 的 字符 串 
写 出 来 ! 


你 注意 到 了 我 们 刚 做 的 的 微妙 但 重要 的 跳跃 吗 ? 


15.2.3.2 程序 终止 


我 们 观察 到 ， 试 图 直接 地 计算 Q 的 类 型 ， 需 要 先 计算 y 的 类 型 ， 这 似乎 导致 了 严重 的 问题 。 然 
后 我 们 就 得 出 结论 : 此 类 型 不 能 用 有 限 长 度 的 字符 串 表 示 ， 但 是 这 只 是 直觉 的 结果 ， 并 非 证 
明 。 更 奇怪 的 事实 是 : 在 我 们 迄今 定义 的 类 型 系统 中 ， 根 本 无 法 给 出 Q 的 类 型 ! 


这 是 一 个 很 强 的 表述 ， 但 事实 上 我 们 可 以 给 出 更 强 的 描述 。 我 们 目前 所 用 的 静态 类 型 语言 有 
一 个 属性 ， 称 为 强 归 一 化 (strong normalization) : 任何 有 类 型 的 表达 式 都 会 在 有 限 步 骤 后 
终止 计算 。 换 句 话 ， 这 个 特殊 的 (奇特 的 ) 无 限 循 环 程序 并 不 是 唯一 不 可 获得 类 型 的 程序 ; 
任何 无 限 循 环 (或 潜在 存在 无 限 循 环 ) 程序 都 无 法 求 得 类 型 。 一 个 简单 的 直觉 说 明 可 以 帮助 
我 们 理解 ， 任 何 类 型 一 一 必须 能 被 有 限 长 度 的 字符 串 表 示 只 能 包含 有 限 个 -> ， 每 次 调用 
会 去 除 一 个 -> ， 因 此 我 们 只 能 进行 有 限 次 数 的 函数 调用 。 





如 果 我 们 的 程序 只 允许 非 转 移 程 序 (straight-line program) ， 这 点 也 无 足 为 奇 。 但 是 ， 我 们 
有 条 件 语句 ， 还 有 可 以 当做 值 任意 传递 的 函数 ， 通 过 这 些 我 们 可 以 编码 得 到 任何 我 们 想 要 的 
数据 结构 。 然 而 我 们 仍 能 得 到 这 个 保证 ! 这 使 得 这 个 结果 令 人 吃惊 。 


练习 题 


试 着 使 用 函数 分 别 在 动态 类 型 和 静态 类 型 语言 中 编码 实现 链表 。 你 看 到 了 什么 ? 这 说 明 
此 类 型 系统 对 于 编码 产生 了 何 种 影响 ? 
这 个 结果 展示 了 某 种 更 深层 次 的 东西 。 它 表明 ， 和 你 可 能 相信 的 一 一 类 型 系统 只 是 用 来 避免 
一 些 程序 BUG 在 运行 时 才 被 发 现 一 相反， 类 型 系统 可 能 改变 语言 的 语义 。 之 前 我 们 一 两 行 
就 能 写 出 无 限 循 环 ， 现 在 我 们 怎么 都 写 不 出 来 。 这 也 表明 ， 类 型 系统 不 仅 可 以 建立 关于 某 个 
特定 程序 的 不 变量 ， 还 能 建立 关于 语言 本 身 的 不 变量 。 如 果 我 们 非常 需要 确保 茶 个 程序 将 会 
终止 ， 只 要 用 该 语言 来 写 然 后 交 由 类 型 检查 器 检查 通过 即 可 。 


一 门 语言 ， 用 其 书写 的 所 有 程序 都 将 终止 ， 有 什么 用 处 ? 对 于 通用 编程 来 说 ， 当 然 没 用 。 但 
是 在 很 多 特殊 领域 ， 这 是 非常 有 用 的 保证 。 例 如 ， 你 要 实现 一 个 复杂 的 调度 算法 ; 你 希望 知 
道 调度 程序 保证 会 终止 ， 以 便 那 些 被 调度 的 任务 被 执行 。 还 有 许多 其 他 领域 ， 我 们 将 从 这 样 
的 保证 中 受益 : 路 由 器 中 的 数据 包 过 滤器 ; 实时 事件 处 理 器 ; 设备 初始 化 程序 ; 配置 文件 ; 
单线 程 JavaScript 中 的 回调 ; 甚至 编译 器 或 链接 器 。 每 种 情况 下 ， 我 们 都 有 一 个 不 成 文 的 期 
望 ， 即 这 些 程序 最 终 会 终止 。 而 现在 我 们 有 一 个 语言 能 保证 这 点 且 这 点 是 不 可 测试 的 。 





这 不 是 假想 的 例子 。 在 Standard ML 语言 中 ， 链 接 模块 基本 上 就 是 使 用 这 种 静态 类 型 语言 
来 编写 模块 链接 规范 。 这 意味 着 开发 人 员 可 以 编写 相当 复杂 的 抽象 概念 毕竟 可 以 将 
函数 作为 值 使 用 一 一 且 同 时 链接 过 程 被 保证 会 终止 ， 产 生 最 终 的 程序 。 





15.2.3.3 静态 类 型 的 递归 

这 就 意味 着 ， 之 前 我 们 可 以 只 通过 去 语法 糖 来 实现 rec ， 现 在 则 必须 在 我 们 的 静态 类 型 语言 
中 显 式 的 实现 。 简 单 起 见 ， 我 们 仅 考 虑 rec 的 一 种 特殊 形式 它 涵盖 了 常见 用 法 ， 即 递归 
标识 符 被 绑 定 到 函数 。 因 此 ， 表 层 语 法 中 ， 我 们 可 能 写 出 如 下 的 累加 函数 : 





(rec (二 num (Cn num) 
(ifo n 
0 
(n+(z(n+-1))))) ;译注 ， 原 文 如 此 ，+ 应 前 置 
(> 10) ) 


其 中 ， 工 是 函数 名 ，n 为 其 参数 ” num 为 函数 参数 以 及 返回 值 的 类 型 表达 式 (> 10) 表示 
使 用 该 函数 计算 从 10 累加 到 0 的 和 。 


如 何 计算 这 个 表达 式 的 类 型 ?显然 ， 求 类 型 过 程 中 ，n 在 函数 体 中 的 类 型 需要 绑 定 〈 但 是 在 
函数 调用 处 就 不 需要 了 ) ; 这 一 点 计算 函数 类 型 的 时 候 我 们 就 知道 了 。 那 么 z= 呢 ? 显 然 ， 在 
检查 (z 10) 的 类 型 时 ， 它 应 该 在 类 型 环境 中 被 绑 定 ， 类 型 必须 为 num -> num 。 不 过 ， 在 检 
查 函 数 体 时 ， 它 同样 需要 被 绑 定 到 此 类 型 。 (还 要 注意 ， 郊 数 体 返回 值 的 类 型 需要 和 事先 声 
明 的 返回 类 型 相同 。) 


现在 我 们 可 以 看 到 如 何 打 破 类 型 有 限 性 的 束缚 。 程 序 代码 中 ， 我 们 只 能 编写 包含 有 限 数 
量 -> 的 类 型 。 但 是 ， 这 种 递归 类 型 的 规则 在 函数 体 中 引用 自身 时 复制 了 -> ， 从 而 供应 了 无 
穷 的 函数 调用 。 这 是 包含 无 穷 箭 夭 的 箭 简 。 


实现 这 种 规则 的 代码 如 下 。 假 设 f 被 绑 定 到 函数 的 名 字 ， aT 是 函数 和 参数 的 类 型 ， rT 为 返 
回 类 型 ，b 是 函数 体 ，u 是 函数 的 使 用 : 


<tc-lamC-case> : := 


[recC (f a aT rT b u) 
(let ([extended-env 
(extend-ty-env (bind f (funT aT rT)) tenv)]) 
(cond 

[(not (equal? rT (tc b 
(extend-ty-env 
(bind a arT) 
extended-env)))) 

(error 'tc "body return type not correct")] ; 骂 数 体 类 型 错误 

[else (tc u extended-env)]))] 


15.2.4 数据 中 的 递归 
我 们 已 经 见识 了 静态 类 型 的 递归 程序 ， 但 是 它 还 不 能 使 我 们 创建 递归 的 数据 。 我 们 已 经 有 一 


种 递归 数据 一 函数 类 型 一 但 是 这 是 内 建 的 。 现 在 还 没 看 到 如 何 创建 自 定义 的 递归 数据 类 


型 。 


15.2.4.1 递归 数据 类 型 定义 


当 我 们 说 允许 程序 员 创 建 递归 数据 时 ， 我 们 实际 在 同时 谈论 三 种 东西 : 


。 创建 新 的 类 型 
。 让 新 类 型 的 实例 拥有 一 个 或 多 个 字段 
。 让 这 些 字段 中 的 某 些 指向 同类 型 的 实例 


实际 上 ， 一 旦 我 们 允许 了 第 三 点 ， 我 们 就 作 须 再 允许 一 点 : 
。 允许 该 类 型 中 非 递归 的 基本 情况 的 存在 


这 些 设计 准则 的 组 合 产 生 了 通常 被 称 为 代数 数据 类 型 (algebraic datatype ) 的 东西 ， 比 如 我 
们 的 静态 语言 中 支持 的 类 型 。 举 个 例子 ， 考 虑 下 面 这 个 数 二 又 树 的 定义 : 【注释 】 


(define-type BTnum 
[BTmt] 
[BTnd (Cn : number) (1 : BTnum) (r : BTnum)]) 


后 面 我 们 会 讨论 如 何 参 数 化 类 型 。 


请 注意 ， 如 果 这 个 新 的 数据 类 型 没有 名 字 ， BTnum ， 我 们 将 不 能 在 BTnd 中 引用 回 该 类 型 。 同 
样 地 ， 如 果 只 允许 定义 一 种 BTnum 构造 ， 那 么 就 无 法 定义 BTmt ， 这 会 导致 递归 无 法 终止 。 
当然 ， 最 后 我 们 需要 多 个 字段 (如 BTnd 中 的 一 样 ) 来 构造 有 用 、 有 趣 的 数据 。 换 名 话说 ， 所 
有 这 三 种 机 制 被 打包 在 一 起 ， 因 为 它们 结合 在 一 起 才 最 有 用 。 (但 是 ， 有 些 语言 确实 允许 定 
义 独 立 结构 体 。 后 文 我 们 将 回来 讨论 这 个 设计 决策 对 类 型 系统 的 影响 ) 。 


我 们 关于 递归 表示 的 初步 讨论 暂 告 一 个 段落 ， 但 这 里 有 个 严重 的 问题 。 我 们 并 没有 站 正 解释 
这 个 新 的 数据 类 型 BTum 的 来 源 。 因 为 我 们 不 得 不 假装 它 已 经 在 我 们 的 类 型 检查 器 中 实现 了 。 
然而 ， 为 每 个 新 的 递归 类 型 改变 我 们 的 类 型 检查 器 有 点 不 切实 际 一 一 这 就 好 比 需要 为 每 个 新 
出 现 的 递归 函数 去 修改 解释 器 ! 相反 ， 我 们 需要 找到 一 种 方法 ， 使 得 这 种 定义 成 为 静态 类 型 
语言 的 固有 和 能力。 后 面 我 们 会 回来 讨论 这 个 问题 。 


这 种 风格 的 数据 定义 有 时 也 被 称 为 乘积 的 和 ，“ 乘 " 指 代 字 段 组 合成 不 变量 的 方式 : 例 
如 ， BTnd 的 合法 值 是 传递 给 BTnd 构造 器 的 每 个 字段 合法 值 的 又 乘 。“ 和 "是 所 有 这 些 不 变量 
的 总 数 : 任何 给 定 的 BTnum 值 是 其 中 之 一 。 (将 " 乘 " 想 作 * 且 "，“ 加 " 想 作 "或 "。) 


15.2.4.2 自 定义 类 型 


想 一 想 ， 数 据 结 构 的 定义 会 产生 哪些 影响 ? 首先 ， 它 引入 了 新 的 类 型 ; 其 次 它 基 于 此 类 型 定 
义 若 干 构造 器 、 谓 词 和 选择 器 。 例 如 ， 在 上 面 的 例子 中 ， 首 先 引 入 BTnum ， 然 后 使 用 它 创建 
以 下 类 型 : 


BTmt : -> BTnum 

BTnd : number * BTnum * BTnum -> BTnum 
BTmt2?2 : BTnum -> boolean 

BTnd? : BTnum -> boolean 

BTnd-n : BTnum -> number 

BTNnd-1] : BTnum -> BTnum 

BTnd-r : BTnum -> BTnum 


。 这 里 的 谓词 函数 都 接受 BTnum 类 型 参数 ， 而 不 是 “Any”( 任 意 值 ) 。 这 是 因为 类 型 系统 已 
经 可 以 告诉 我 们 某 个 值 的 类 型 是 什么 ， 因 此 我 们 只 需要 区 分 该 类 型 的 不 同形 式 。 
。 选择 器 只 能 作用 于 类 型 中 相关 形式 的 实例 一 一 例如 ， BTnd-n 只 对 BTnd 的 实例 有 效 ， 
对 BTmt 的 实例 则 不 行 一 一 但 是 由 于 缺乏 合适 的 静态 类 型 ， 我 们 无 法 在 静态 类 型 系统 中 表 
示 这 点 。 


递归 类 型 中 还 有 很 多 值得 讨论 的 东西 ， 我 们 不 久 将 回 到 这 个 话题 。 


15.2.4.3 模式 匹配 和 去 语法 糖 


类 型 定义 的 讨论 告 一 段落 ， 剩 下 要 提供 的 功能 就 是 模式 匹配 。 例 如 ， 我 们 可 以 这 样 写 : 


(type-case BTnum t 
[BTnum () ei] 
[BTnd (nv lt rt) e2]) 


我 们 知道 ， 这 可 以 用 前 述 的 函数 来 实现 。 用 let 就 可 以 模拟 此 模式 匹配 所 实现 的 绑 定 : 


(cond 
[(BTmt? t) el] 
[(BTnd? t) (let ([nv (BTnd-n t)] 
[It (BTnd-1 t)] 
[rt (BTnd-r t)] 
e2)]) 


总 之 ， 它 可 以 通过 宏 实现 ， 所 以 模式 匹配 不 需要 被 添加 到 核心 语言 中 ， 直 接 用 去 语法 糖 即 可 
实现 。 这 也 意味 着 一 门 语言 可 以 有 很 多 不 同 的 模式 匹配 机 制 。 


不 过 ， 这 不 完全 正确 。 生 成 上 面 代码 中 的 cond 表达 式 时 2 宏 需 要 通过 某 种 手段 知道 BTnd 的 

三 个 位 置 选择 器 分 别 是 BTnd-n 、 BTnd-1 和 BTnd-r 。 这 些 信息 在 类 型 定义 时 显 式 给 出 ， 但 是 
在 模式 匹配 时 是 隐 含 的 〈 划 重点 ) 。 因 此 ， 这 些 信息 必须 要 从 类 型 定义 处 传 过 来 。 因 此 宏 展 

开 器 需要 使 用 类 似 类 型 环境 的 东西 完成 其 任务 。 





此 外 ， 还 要 注意 ， 例 如 el 和 e2 这 样 的 表达 式 无 法 类 型 检查 事实 上 ， 其 至 不 能 被 可 靠 地 
识别 为 表达 式 直到 完成 了 type-case 的 宏 展 开 之 后 。 因 此 ， 展 开 依赖 于 类 型 环境 ， 而 类 
型 检查 依赖 于 展开 的 结果 。 换 名 话说 这 两 者 是 共生 关系 ， 不 仅仅 是 并 行 运行 ， 而 是 同步 运 
行 。 因 此 ， 静 态 类 型 语言 中 进行 去 语法 糖 操作 时 ， 如 果 语 法 糖 需 要 对 相关 类 型 作出 推测 ， 要 


比 动态 类 型 语言 中 更 复杂 一 些 。 





15.2.5 类 型 、 时 间 和 空间 


明显 ， 类 型 已 经 赋予 了 类 型 安全 语言 一 些 性 能 优势 。 因 为 一 些 本 来 需要 运行 时 执行 的 检查 
(《 例 如， 检查 加 法 的 两 个 参数 的 确 是 数 ) 现在 是 静态 执行 的 。 在 静态 类 型 语言 中 ， 类 

似 :number 的 注解 已 经 回答 了 关于 某 个 值 是 否 是 特定 类 型 这 种 问题 ; 无 需 在 运行 时 再 去 检 
查 。 因 此 ， 类 型 级 别 的 谓词 以 及 程序 中 对 它们 的 使 用 将 会 (并且 需 要 ) 完全 消失 。 


系统 他 们 的 程序 不 会 导致 类 型 


对 于 开发 者 来 说 这 需要 付出 一 些 代 价 ， 他 们 必须 说 服 静态 类 型 
可 能 与 类 型 系统 冲突 。 不 过 ， 类 型 


错误 ; 由 于 可 判定 性 的 限制 ， 有 些 可 以 正确 运行 的 程序 也 
系统 为 满足 了 它 要 求 的 程序 提供 了 可 观 的 运行 时 性 能 优势 。 


接 下 来 我 们 来 讨论 空间 。 到 目前 为 止 ， 语 言 的 运行 时 系统 需要 对 每 个 值 附加 存储 其 类 型 信 

息 。 这 也 是 其 实现 类 型 级 别 谓词 如 number? 的 基础 ， 这 些 谓词 既 可 被 开发 人 员 使 用 也 可 被 语 
言 内 部 使 用 。 如 果 不 需要 这 些 谓词 ， 那 么 这 些 为 了 实现 它们 而 存储 的 信息 所 占据 的 空间 也 将 
不 再 需要 。 因 此 (静态 语言 ) 不 需要 类 型 标签 。 


然而 ， 垃 圾 回收 器 仍然 需要 它们 ， 但 其 他 表示 法 (如 BIBOP( 译 注 Blg Bag Of Pages)) 能 
极 大 减少 它们 对 空间 的 需求 。 


类 型 变 体 相关 的 谓词 仍 要 保留 : 如 上 面 例子 中 的 BTmt9 和 BTnd? 。 它 们 的 调用 需要 在 运行 时 
求 值 。 例 如 ， 如 前 所 述 ， 选 择 器 BTnd-n 就 需要 执行 这 种 检查 。 当 然 ， 进 一 步 的 优化 是 可 能 

的 。 考 虑 模式 匹配 去 语法 糖 后 生成 的 代码 : 其 中 的 三 个 选择 器 就 无 需 执 行 这 些 检查 ， 因 为 只 
有 BTnd? 返回 监 值 时 才 会 执行 对 应 代码 片 。 因 此 ， 运 行 时 系统 可 以 给 去 语法 糖 层 面 提供 特殊 
的 不 安全 (Unsafe) 指令 ， 也 就 是 不 执行 类 型 检查 的 版 本 ， 从 而 生成 如 下 所 示 的 代码 : 


(cond 
[(BTmt? t) el1] 
[(BTnd? t) (let ([nv (BTnd-n/no-check t)] 
[lt (BTNnd-l/no-check t)] 
[rt (BTnd-r/no-check t)]) 
e2)]) 


但 最 终 的 结果 是 ， 运 行 时 系统 仍然 需要 存储 足够 的 信息 来 准确 回答 这 些 问题 。 不 过 ， 相 比 于 
之 前 需要 使 用 足够 的 位 来 区 分 每 种 类 型 及 类 型 变 体 ， 现 在 ， 由 于 类 型 被 静态 地 隔离 了 ， 对 于 
没有 变 体 的 类 型 (例如 ， 只 有 一 种 类 型 的 字符 串 ) ， 不 再 需要 存储 任何 变 体 相关 的 信息 ; 这 
意味 着 运行 时 系统 可 以 使 用 所 有 可 用 位 来 存储 实际 的 动态 值 。 


与 之 相对 ， 如 果 类 型 存在 变 体 ， 运 行 时 系统 需要 牺牲 一 些 空间 用 于 区 分 不 同 变 体 ， 不 过 一 个 
类 型 中 变 体 的 数量 显然 比 所 有 类 型 和 其 变 体 的 数量 要 小 得 多 。 在 上 面 的 例子 中 ， BTnum 只 有 
两 个 变 体 ， 因 此 运行 时 系统 只 需要 使 用 一 个 比特 来 记录 某 个 值 是 BTnum 的 哪个 变 体 。 


特别 要 注意 的 是 ， 类 型 体系 的 隔离 可 以 防止 混淆 。 如 果 有 两 种 不 同 的 数据 类 型 ， 每 种 都 有 两 

种 变 体 ， 在 动态 类 型 的 世界 中 ， 所 有 这 四 种 变 体 都 需要 有 不 同 的 表示 法 ; 与 之 相对 ， 在 静态 
类 型 的 世界 中 ， 这 些 表示 法 可 以 跨 类 型 重重 ， 因 为 静态 类 型 系统 会 保证 一 种 类 型 中 的 变 体 和 
另 一 种 类 型 中 的 不 被 混淆 。 因 此 ， 类 型 系统 对 于 程序 的 空间 (节约 表示 所 需 空 间 ) 和 时 间 
(消除 运行 时 检查 ) 上 都 有 实打实 的 性 能 提升 。 


15.2.6 类 型 和 赋值 


我 们 已 经 覆盖 了 核心 语言 中 除 赋 值 之 外 的 大 部 分 基本 特性 。 从 某 些 方面 看 ， 类 型 和 赋值 之 间 
的 相互 作用 很 简单 ， 这 是 因为 在 经 典 环境 中 ， 它 们 根本 不 相互 人 作用。 例如， 考虑 下 面 动态 类 
型 程序 : 


(let ([x 10]) 
(begin 
(set! x 5) 
(set! x" 某 物 "))) 


x 的 “类 型 "是 什么 ? 它 并 没有 确定 的 类 型 ， 它 在 一 段 时 间 内 是 数 ， 后 来 (注意 里 面 药 含 时 间 
意味 ) 是 字符 串 。 我 们 根本 无 法 给 它 定 类 型 。 一 般 来 说 ， 类 型 检查 是 种 非 时 间 性 的 活动 : 它 
只 在 程序 运行 之 前 执行 一 次 ， 因 此 必须 独立 于 程序 执行 的 特定 顺序 。 因 此 ， 跟 踪 贮 存 中 的 精 
确 值 超出 了 类 型 检查 程序 的 能 力 范 围 。 


上 面 的 例子 当然 可 以 简单 的 静态 的 被 理解 ， 不 过 我 们 不 能 被 简单 的 例子 误导 。 考 虑 下 面 的 程 
序 : 


(let ([x 16]) 
(if (even? (read-number "输入 数字 " ) ) 
(set! x 5) 
(set! x" 某 物 "))) 


现在 ， 静 态 检 查 不 可 能 得 到 关于 x 的 类 型 的 结论 ， 因 为 只 有 在 运行 时 我 们 才能 获得 用 户 输入 
的 值 。 


为 了 避免 这 种 情况 ， 传 统 的 类 型 检查 器 采用 了 一 个 简单 策略 : 赋值 过 程 中 类 型 必须 保持 不 

变 。 也 就 是 说 ， 赋 值 操作 ， 不 论 是 变量 赋值 还 是 结构 体 赋值 ， 都 不 能 改变 被 赋值 的 量 的 类 
型 。 因 此 ， 上 面 的 代码 在 我 们 当前 的 语言 中 将 不 能 通过 类 型 检查 。 给 程序 员 提 供 多 少 灵 活性 
就 取决 与 语言 了 。 例 如 ， 如 果 我 们 引入 更 加 灵活 的 类 型 表示 "“ 数 或 字符 串 "， 上 面 的 例子 将 能 通 
过 类 型 检查 ， 但 是 x 的 类 型 就 永远 不 那么 精确 ， 所 有 使 用 x 的 地 方 都 需要 处 理 这 种 降低 了 的 
精度 ， 后 面 我 们 会 回 到 这 个 问题 。 


简 而 言 之 ， 在 传统 的 类 型 系统 中 赋值 相对 容易 处 理 ， 因 为 它 采 用 了 简单 的 规则 ， 值 可 以 在 类 
型 系统 指定 的 限度 下 进行 改变 ， 但 是 类 型 不 能 被 改变 。 在 像 set! 这 种 操作 的 情况 下 (或 者 我 
们 的 核心 语言 中 的 setc ) ， 这 意味 着 赋值 的 类 型 必须 和 变量 的 类 型 匹配 。 在 结构 体 赋 值 的 情 
况 下 ， 例 如 box ， 这 意味 着 赋值 的 类 型 必须 和 box 容器 内 容 的 类 型 匹配 。 


15.2.7 中 心 定理 : 类 型 的 可 靠 性 


之 前 我 们 说 过 ， 一 些 静 态 类 型 语言 可 以 为 其 书写 的 程序 所 能 达成 菜 些 特性 作出 很 坚实 的 证 
明 : 例如 ， 该 语言 书写 的 程序 肯定 会 终止 。 当 然 ， 一 般 来 说 ， 我 们 无 法 获得 这 样 的 保证 〈 事 
实 上 ， 正 是 为 了 能 写 限 循环 我 们 才 添 加 的 通用 递归 ) 。 然 而 ， 一 个 有 意义 的 类 型 系统 


写 
出 无 
一 一 事实 上 ， 任 何 值得 类 型 系统 这 一 高 贵 头 衔 的 东西 【注释 】 一 一 应 该 为 所 有 静态 类 型 程序 


提供 茶 种 有 意义 的 保证 。 给 程序 员 的 回报 : 通过 给 程序 加 上 类 型 ， 她 可 以 确保 某 些 不 好 
的 事情 不 会 发 生 。 ss ， 我 们 也 能 找到 bug ; 这 是 有 用 的 ， 但 它 不 足以 提供 构建 高 级 
别 工具 (例如 要 保证 安全 性 、 隐 私 性 或 健壮 性 ) 的 必要 基础 。 


我 们 一 再 使 用 “类 型 系统 "这 个 术语 。 类 型 系统 通常 是 三 个 组 件 的 组 合 : 类 型 的 语言 ~、 类 型 
规则 ， 以 及 将 这 些 规则 应 用 于 程序 的 算法 。 我 们 的 讨论 中 将 类 型 规则 放 入 函数 中 ， 因 此 
模糊 了 第 二 者 和 第 三 者 之 间 的 区 别 ， 但 它们 仍然 可 以 在 逻辑 上 加 以 区 分 


我 们 可 能 希望 类 型 系统 给 我 们 提供 什么 样 的 保证 呢 ? 请 记 住 ， 类 型 检查 器 在 程序 运行 前 静态 
地 对 程序 进行 检查 。 这 意味 着 它 本 质 上 是 对 程序 行为 的 预测 : 例如 ， 当 它 指出 茶 be 
式 的 类 型 为 num ， 它 实际 是 在 预测 程序 运行 时 ， 该 表达 式 将 产生 一 个 数值 。 我 们 怎么 知 ; 
个 预测 是 正确 的 呢 ， 也 就 是 说 检查 器 从 不 撒谎 ? 每 种 类 型 系统 都 应 该 附带 一 个 证 明 这 一 
定理 。 


对 于 类 型 系统 存疑 有 一 个 很 好 的 理由 ， 不 是 怀疑 主义 的 那 种 。 类 型 检查 器 和 程序 求 值 器 工作 
方式 上 有 很 多 不 同 : 


。 类 型 环境 将 标识 符 绑 定 到 类 型 ， 求 值 器 。 

。 类 型 检查 器 将 值 的 集合 (甚至 0 而 求 值 器 处 理 的 是 值 本 身 。 

。 关 型 检查 器 一 定 会 终止 ， 求 值 器 不 一 定 会 。 

。 类 型 检查 器 仅 需 检查 表达 式 一 a 


e。 类 型 检查 器 能 见 到 的 只 有 程序 文本 ， 求 值 器 运行 在 点 实 的 存储 器 上 。 


因此 ， 我 们 不 应 假设 这 两 者 将 始终 对 应 ! 


对 于 给 定 ， 我 们 希望 达到 的 核心 目标 是 一 一 该 类 型 系统 是 可 靠 的 (sound) 。 它 的 
意思 是 定 表达 式 (或 者 程序 ) e ， 类 型 检查 得 出 其 类 型 为 t ， 当 我 们 运行 e 时 ， 假 设 
a v， 那 么 v 的 类 型 是 t 。 





证 明 这 个 定理 的 标准 方法 是 分 两 步 进 行 ， 进 展 (progress) 和 保持 (preservation) 。 进 展 的 
意思 是 ， 如 果 一 个 表达 式 能 够 通过 类 型 检查 ， 那 么 它 应 该 能 进行 进一步 求 值 得 到 新 的 东西 
(除非 它 本 身 就 是 值 ) ; 保持 的 意思 是 ， 这 个 求 值 步骤 前 后 类 型 不 变 。 如 果 我 们 交错 进行 这 

些 步骤 (先进 展 再 保持 ， 不 断 重复 ) ， 可 以 得 出 一 个 结论 ， 最 终 的 结果 和 最 初 被 求 值 的 表达 


式 类 型 相同 ， 因 此 类 型 系统 确实 是 可 车 的 。 


例如 ， 考 虑 表达 式 : (+ 5 (* 2 3)) 。 它 的 类 型 为 num 。 在 一 个 可 靠 的 类 型 系统 中 ， 进 展 证 
明 ， 由 于 该 表达 式 能 通过 类 型 检查 ， 且 其 当前 不 是 值 ， 它 可 以 进行 一 步 求 值 一 一 这 里 它 显然 
可 以 。 进 行 一 步 求 值 之 后 ， | (+ 5 2 。 不 出 所 料 ， 正 如 保持 给 出 的 证 明 ， 它 的 
类 型 也 为 num 。 进 展 表 明 它 还 能 进行 一 步 求 值 ， 得 到 11 。 保 持 再 次 表明 它 的 类 型 和 上 一 步 
的 表达 式 类 型 相同 ， 都 为 num 。 9 ， 进展 发 现 我 们 已 经 得 到 最 终结 果 ， 无 后 续 要 进行 的 求 
值 步骤 ， 该 值 的 类 型 和 最 初 的 表达 式 类 型 相同 。 


但 这 不 是 完整 的 故事 。 有 两 点 需要 说 明 : 


1. 程序 可 能 不 会 得 出 最 终 的 结果 ， 它 可 能 永远 循环 。 这 种 情况 下 ， 该 定理 严格 来 说 并 不 适 
用 。 但 是 我 们 仍 能 看 到 ， 计 算得 到 的 中 间 表 达 式 类 型 将 一 直 保 持 不 变 ， 因 此 即使 程序 没 
有 最 终 产生 一 个 值 ， 它 仍 在 进行 着 有 意义 的 计算 。 

2， 任 何 特性 足够 丰富 的 语言 中 都 存在 一 些 不 能 静态 决定 的 属性 〈 有 些 属 性 也 许 本 来 可 以 ， 
但 是 语言 的 设计 者 决定 将 其 推迟 到 运行 时 决定 ) 。 当 这 类 属性 出 错时 一 一 比如 ， 数 组 的 
索引 越界 关于 这 种 程序 没有 很 好 的 类 型 可 以 约束 它们 。 因 此 ， 每 个 类 型 完备 性 定理 
中 都 隐 含 了 一 组 已 发 布 的 、 人 允许 的 异常 或 者 可 能 发 生 的 错误 条 件 。 使 用 该 类 型 系统 的 开 
发 者 隐 式 的 接受 了 这 些 条 件 。 





作为 第 二 点 的 一 个 例子 ， 典 型 的 静态 类 型 语言 中 ， 都 会 指明 对 于 向 量 的 寻 址 、 链 表 的 索引 等 
操作 可 能 抛 出 异常 。 


后 面 这 个 说 明 好 像 站 不 住 脚 。 事 实 上 ， 我 们 很 容易 忘记 这 其 实 是 一 条 关于 运行 时 不 能 发 生 的 
事情 的 陈述 : 这 一 组 异常 之 外 的 异常 将 能 被 证 明 不 会 产生 。 妆 然 ， 对 最 开始 就 设计 为 静态 类 
型 的 语言 ， 除 了 不 那么 严格 的 类 比 外 ， 可 能 摘 不 清 这 组 异常 具体 是 什么 ， 因 为 一 开始 本 就 无 
须 定义 它们 。 但 是 当 我 们 将 类 型 系统 添加 到 已 有 的 语言 时 一 一 特别 是 动态 类 型 语言 ， 如 
Racket 或 Python 一 一 那么 这 里 已 经 有 一 组 明确 定义 的 异常 ， 类 型 检查 器 将 会 指明 其 中 一 些 异 
常 〈( 像 “函数 调用 位 置 不 是 函数 "或 者 "未 找到 方法 ") 不 会 发 生 。 这 就 是 程序 员 接 纳 类 型 系统 语 
法 上 限制 所 得 到 的 回报 。 


15.3 对 核心 的 扩展 


现在 我 们 已 经 有 了 基础 的 静态 类 型 语言 ， 下 面 探索 一 下 如 何 将 其 扩展 成 为 更 有 用 的 编程 语 


0° 


wl 


15.3.1 显 式 的 参数 多 态 
下 面 哪些 是 相同 的 ? 


@ List<String> 
@ List<String> 


© (listof string) 


事实 上 ， 上 面 任 何 两 个 都 不 太一 样 。 但 是 第 一 个 和 第 三 个 非常 相似 ， 因 为 第 一 个 是 Java 代 码 
而 第 三 个 是 我 们 的 静态 语言 代码 ， 而 第 二 个 ， 是 C++ 代码 ， 和 其 它 两 个 不 同 。 清 楚 了 吗 ? 不 清 
楚 ? 很 好 ， 继 续 往 下 读 | 


15.3.1.1 参数 化 类 型 


我 们 所 使 用 的 编程 语言 已 经 展示 了 参数 多 态 的 价值 ， 例 如 ， map 函数 的 类 型 可 以 这 样 给 出 : 


(('a -> 'b) (listof 'a) -> (listof 'b)) 


意思 是 ， 对 于 任意 类 型 'a 和 'b ，map 读 入 一 个 从 'a 到 'b 的 函数 ， 一 个 'a 的 链表 ， 生 
成 对 应 的 'b 的 链表 。 这 里 ，'a 和 'b 不 是 具体 的 类 型 ; 它们 是 类 型 变量 (我 们 的 术语 中 ， 
这 应 该 被 称 为 “类 型 标识 符 "， 因 为 它们 在 实例 化 过 程 中 不 会 变化 ; 但 是 我 们 还 是 使 用 传统 术 


语 ) 。 


可 以 换 种 方式 理解 它 : 实际 上 有 一 族 无 穷 多 的 这 样 的 map 函数 。 例 如 ， 其 中 一 个 map 的 类 型 
是 这 样 的 : 


((number -> string) (listof number) -> (listof string)) 


Cs 


另 一 个 的 类 型 是 这 样 的 (没有 限制 说 其 中 的 类 型 必须 是 基本 类 型 ) 


((number -> (number -> number)) (listof number) -> (listof (number -> number))) 


还 有 这 样 的 (也 没有 限制 说 ,a 和 'b 必须 不 同 ) 


((string -> string) (listof string) -> (listof string)) 


以 此 类 推 。 由 于 它们 的 类 型 不 同 ， 名字 也 需要 不 

同 : map_num_str 、 map_num_num->num 、 map_str_str 等 。 但 是 这 会 让 它们 变 成 不 同 的 函数 ， 
于 是 我 们 总 得 使 用 某 个 特定 map ， 而 不 是 直接 使 用 比较 一 般 的 那个 。 

显然 ， 不 可 能 将 所 有 这 些 函 数 放 到 我 们 的 标准 库 中 : 毕竟 它们 有 无 穷 多 个 ! 更 好 的 方式 是 能 
按 需 获取 我 们 需要 的 函数 。 我 们 的 命名 规则 给 出 了 一 点 提示 : map 接受 两 个 参数 ， 它 们 都 是 
类 型 。 给 定 了 两 个 类 型 作为 参数 ， 我 们 可 以 得 到 针对 特定 类 型 的 map 函数 。 这 种 类 型 的 参数 
化 被 称 为 参数 多 态 。 


注意 不 要 和 对 象 “多 态 " 搞 混 ， 后 面 会 讨论 它 。 


15.3.1.2 显 式 声明 类 型 参数 


换 名 话说， 我 们 相当 于 说 map 实际 上 是 有 四 个 参数 的 函数 ， 其 中 两 个 是 类 型 ， 另 外 两 个 是 实 
际 的 值 〈 函 数 和 链表 ) 。 在 需要 显 式 声明 类 型 的 语言 中 ， 我 们 需要 写成 类 似 这 样 : 


(define (map [a : ???] [b : ???] [f : (a -> b)] [1 : (listof a)]) : (listof b) 


但 是 这 会 产生 一 些 问题 。 首 先 ， ??? 处 应 该 填 什 么 ? 它 是 a 和 b 的 类 型 。 但 是 如 果 a 和 b 本 
身 将 被 类 型 替换 ， 那 么 类 型 的 类 型 是 什么 ? 其次， 我们 丰 的 希望 每 次 调用 map 的 时 候 传 入 四 
个 参数 吗 ? 再 者 ， 我 们 昌 的 希望 在 接收 任何 实际 值 之 前 先 接收 类 型 参数 吗 ? 对 于 这 些 问题 的 
答案 能 延伸 出 关于 多 态 类 型 系统 巨大 的 讨论 空间 ， 其 中 的 大 部 分 我 们 这 里 将 不 会 涉及 。 


推荐 阅读 Pierce 的 《Types and Programming Languages( 类 型 和 编程 语言 )》， 获 取 鸡 
懂 、 现 代 的 介绍 。 


注意 到 一 旦 我 们 引入 参数 化 ， 很 多 预期 之 外 的 代码 都 将 被 参数 化 。 例 如 ， 考 虑 平平 无 奇 

的 cons 函数 的 类 型 。 它 的 类 型 需要 基于 链表 中 值 的 类 型 进行 参数 化 (尽管 它 实际 上 并 不 依赖 
于 这 些 值 一 一 稍 后 会 解释 这 一 点 ) ， 于 是 每 次 使 用 cons 时 都 需要 正确 地 进行 类 型 实例 化 。 说 
到 这 ， 即 使 用 empty 创建 空 链 表 也 必须 类 型 实例 化 ! 当然 ，Java 和 C++ 程序 员 应 该 对 这 个 痛 
点 很 熟悉 了 。 


15.3.1.3 一 阶 多 志 


我 们 将 只 讨论 这 个 空间 中 一 个 特别 有 用 且 易 于 理解 的 点 上 ， 也 即 Standard ML 的 类 型 系统 、 
同时 是 本 书 使 用 的 静态 类 型 语言 和 早期 版 本 的 Haskell 的 类 型 系统 ， 有 范 型 加 成 的 Java 和 

C# 以 及 引入 了 模版 的 C++ 也 差不多 获得 了 这 种 类 型 系统 的 大 部 分 能 力 。 这 类 语言 定义 了 被 称 
为 谓词 、 一 阶 或 者 叫 前 级 多 态 的 东西 。 关 于 上 小 节 的 问题 它 的 答案 是 不 境 、 没 有 、 是 。 下 面 
我 们 来 探讨 一 下 。 


我 们 首先 将 类 型 的 世界 分 成 两 组 。 第 一 组 包含 我 们 目前 用 到 的 静态 类 型 语言 ， 另 外 加 上 类 型 
变量 ; 它们 被 称 为 monotype ( 单 型 ) 。 第 二 组 包含 参数 化 的 类 型 ， 被 称 为 polytype (多 
型 ) ; 按 惯例 它们 是 这 样 写 的 : v 前 级 ， 一 组 类 型 变量 ， 再 跟 一 个 类 型 表达 式 ， 表 达 式 中 可 
以 使 用 这 些 类 型 变量 。 因 此 ， map 的 类 型 将 写作 : 


Va,b: (('a -> 'b) (listof 'a) -> (listof 'b)) 


由 于 “ V "是 逻辑 符号 "对 于 所 有 的 "的 意思 ， 于 是 上 面 的 东西 可 以 读 作 :“ 对 于 所 有 类 
型 'a 和 'b， map 的 类 型 为 ...... ”9 


在 一 阶 多 态 (rank-1 polymorphism ) 中 ， 类 型 变量 只 能 被 monotype 替换 。 (此 外 ， 它 们 只 能 
被 具体 类 型 替换 ， 否 则 剩 下 的 类 型 变量 将 无 法 被 蔡 换 掉 。) 因此 ， 在 类 型 变量 参数 和 常规 参 
数 之 间 我 们 有 了 明确 的 界线 。 我 们 不 需要 为 类 型 变量 提供 "类 型 注解 "， 因 为 我 们 知道 它们 可 以 
是 什么 。 这 样 得 到 的 语言 相对 简洁 ， 但 仍 提供 了 相当 的 表达 能 力 。 


非 直 谓 性 语言 (Impredicative language) 取消 了 monotype 和 polytype 的 区 别 ， 因 此 类 


型 变量 可 以 使 用 另 一 个 多 态 类 型 实例 化 。 


注意 到 由 于 类 型 变量 只 能 被 monotype 替换 ， 他 们 全 相互 对 立 。 于 是 ， 类 型 参数 可 以 全 被 提 到 
参数 表 的 前 面 。 这 使 我 们 可 以 使 用 形 如 Vtv，... : t 的 类 型 ， 其 中 tv 是 类 型 变 


量 ，t 是 monotype (其 中 可 以 引用 这 些 类 型 变量 ) 。 此 语法 的 意义 就 在 这 里 ， 这 也 是 之 前 称 
其 为 前 组 多 态 的 原因 。 而 且 后 面 也 将 看 到 这 对 其 实现 也 很 有 用 。 


15.3.1.4 通过 去 语法 糖 实现 一 阶 多 态 解释 器 


该 特性 最 简单 的 实现 就 是 将 其 视 为 一 种 去 语法 糖 的 形式 : C++ 实际 上 就 是 这 么 做 的 。 (具体 
来 说 ， 因 为 C++ 有 一 个 叫做 模版 的 宏 系 统 ， 所 以 使 用 模版 ， 它 非常 巧合 地 达成 了 一 阶 多 

态 。) 举 个 例子 ， 如 果 我 们 有 一 个 语法 形式 define-poly ， 它 接收 名 字 、 类 型 变量 和 表达 式 。 
当 传 入 类 型 的 时 候 ， 它 将 表达 式 中 对 应 类 型 变量 替换 为 此 类 型 ， 因 此 : 


(define-poly (id t) (lambda ([x : t]) : t x)) 


通过 将 id 定义 为 多 态 的 方式 定义 了 一 个 恒 等 (identity) 函数 : 给 t 传 入 递 任意 具体 类 型 ， 
就 得 到 一 个 单 参数 的 类 型 为 (t -> t) 的 函数 (其 中 t 被 蔡 换 ) 。 我 们 可 以 使 用 各 种 类 型 实例 
化 id 


(define id_num (id number)) 
(define id_str (id string)) 


从 而 获得 针对 这 些 类 型 的 恒 等 函 数 : 


(test (id_num 5) 5) 
(test (id_ str “x”) x) 


与 之 相对 ， 像 


(id_num "x") 
(id_str 5) 


这 样 的 表达 式 将 不 能 通过 类 型 检查 (而 不 是 运行 时 出 错 ) 。 


如 果 你 好 奇 的 话 ， 下 面 给 出 了 实现 。 简 单 起 见 ， 我 们 假设 只 有 一 个 类 型 参数 ; 很 容易 使 
用 ... 实现 多 个 参数 的 情形 。 我 们 不 仅 将 define-poly 定义 为 宏 ， 它 


(define-syntax define-poly 
(syntax-rules () 
[( (name tyvar) body) 
(define-syntax (name stx) 
(syntax-case stx () 


[(- type) 
(with-syntax ([tyvar #'typel]) 


#'body)]))]1)) 


因此 ， 对 于 : 


(define-poly (id t) (lambda ([x : t]) : t x)) 


该 语言 将 创建 名 为 id 的 宏 : 对 应 (define-syntax (name ...) ...) 的 部 分 (对 于 这 个 例 

子 ，name 是 id ) 。 id 的 一 个 实例 ， 如 (id number) ， 将 类 型 变量 t 、 宏 里 面 

的 typvar 替换 成 给 定 的 类 型 。 因 为 要 规避 卫生 ， 我 们 用 with-syntax 来 确保 所 有 对 于 类 型 变 
量 (typvar) 的 使 用 被 蔡 换 为 给 定 的 类 型 。 因 此 ， 实 际 效果 是 ， 


(define id_num (id number)) 


被 转换 成 了 


(define id num (lambda ([x : number]) : number x)) 


然而 这 种 方式 有 两 个 重大 局 限 性 


1， 来 试 试 定义 递归 的 多 态 函 数 ， 上 比如 说 filter 。 之 前 我 们 说 过 ， 每 个 多 态 值 ( 例 
如 cons 和 empty ) 都 需要 类 型 实例 化 ， 但 是 为 了 简洁 起 见 我 们 将 依赖 静态 类 型 语言 实现 
这 点 ， 而 仅 专 注 于 filter 的 类 型 参数 。 对 应 代码 是 : 


(define-poly (filter 七 ) 
andagdl (Ee > ooleanln Glnstoh ED (StEof nt) 
(cond 

[(empty? 1) empty] 

Ceonse l(t ty 
(econms (ha 

(Me a ec dl) 

(Mae (rs),) 


注意 到 递归 的 使 用 filter 时 ， 必 须 使 用 恰当 的 类 型 对 其 实例 化 。 


上 面 的 定义 完全 正确 ， 只 有 一 个 问题 ， 当 我 们 尝试 使 用 它 时 一 一 如 : 


(define filter num (filter number)) 


DrRacket 将 不 会 终止 ， 更 准确 的 说 ， 是 宏 展 开 不 会 终止 ， 因 为 它 将 不 断 的 尝试 创 
建 filter 代码 的 副本 。 不 过 如 果 用 下 面 这 种 方式 定义 该 函数 ， 展 开会 终止 一 一 


(define-poly (filter2 t) 
(letrec ([fltr 
Glambqamgt ee > booleamn)an lstomt (stom 
(cond 

[(empty? 1) empty] 
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但 是 这 给 开发 人 员 徒 增 了 不 必要 的 痛苦 。 实 际 上 ， 一 些 模版 展开 程序 会 缓存 之 前 展开 的 
值 ， 避免 对 于 相同 的 参数 反复 生成 代码 。 (Racket 做 不 到 这 点 ， 因 为 一 般 来 说 ， 宏 表达 
式 可 以 依赖 可 变 变 量 和 值 ， 其 至 可 以 执行 输入 输出 ， 因 此 Racket 无 法 保证 同样 的 输入 表 
达 式 总 是 产生 相同 输出 。) 


2. 考虑 恒 等 函 数 的 两 个 实例 。 我 们 无 法 比较 id_num 和 id_str ， 因 为 它们 类 型 不 同 ， 但 即 
使 它们 类 型 相同 ， 使 用 eq? 比较 它们 也 不 同 : 


(test (eq? (id number) (id number)) #f) 


这 是 因为 对 id 每 次 实例 化 都 会 创建 一 份 新 的 代码 副本 。 即 使 使 用 了 上 面 提 到 的 优化 ， 同 
一 种 类 型 对 应 代码 只 有 一 份 副 本 ， 但 是 不 同类 型 的 对 应 代码 体 还 是 会 被 重新 生成 【 注 
释 】 一 一 但 这 也 是 没 必要 的 ! 例如 ， id 的 实现 的 部 分 其 实 没 任何 东西 依赖 于 参数 的 类 
型 。 实 际 上 ， id 这 一 族 无 穷 多 个 的 函数 可 以 共享 同一 个 实现 。 简 单 的 去 语法 糖 策略 实现 
不 了 这 点 。 


事实 上 ， c++ 模版 因 代 码 膨 胀 的 问题 而 自 名 昭著 ， 这 是 原因 之 一 。 


换 种 说 法 ， 基 于 去 语法 糖 的 策略 本 质 上 是 使 用 替换 的 实现 方式 ， 它 有 着 和 我 们 之 前 函数 调用 
时 使 用 替换 的 方式 实现 相同 的 问题 。 不 过 ， 其 它 情况 下 ， 和 替换 策略 能 达成 我 们 关于 程序 行为 
的 期 望 ; 对 于 多 态 也 是 一 样 ， 正 如 我 们 将 看 到 的 一 样 。 


注意 去 语法 糖 策略 的 一 个 好 处 就 是 它 不 需要 类 型 检查 器 “理解 "多 态 。 我 们 的 核心 语言 仍 可 以 是 
单 态 的 《monomorphic) ， 所 有 的 (一 阶 ) 多 态 完全 由 宏 展开 处 理 。 这 提供 了 一 种 廉价 的 将 
多 态 添 加 到 语言 中 的 策略 ， 但 正如 C++ 所 示 ， 它 也 引入 了 很 大 的 开销 。 


最 后 ， 虽 然 这 里 我 们 只 关注 了 咏 数 ， 但 前 面 的 讨论 同样 适用 于 数据 结构 。 


15.3.1.5 其 它 实现 方式 


有 些 其 他 实现 策略 不 会 遇 到 此 类 问题 。 这 里 我 们 不 会 深入 讲解 它们 ， 但 是 其 中 一 些 策 略 的 本 
质 就 是 上 面 提 到 过 的 “缓存 "方法 。 因 为 可 以 确定 的 是 ， 对 于 给 定 的 同一 组 类 型 参数 ， 应 该 得 到 
相同 的 实现 代码 ， 不 需要 对 相同 的 类 型 参数 实例 化 多 次 。 这 避免 了 无 限 循 环 。 如 果 我 们 检查 
了 使 用 特定 类 型 实例 化 的 代码 一 次 ， 后 续 相 同类 型 参数 的 实例 化 结果 就 无 需 再 进行 类 型 检查 
(因为 它 不 会 发 生 改 变 ) 。 此 外 ， 我 们 无 需 保 留 实例 化 后 的 源码 : 一 旦 我 们 检查 了 展开 后 的 
程序 ， 就 可 以 将 其 丢弃 ， 运 行 时 也 只 需要 保留 一 份 实例 化 的 副本 。 这 样 可 以 避免 上 述 纯 去 语 
法 糖 策略 中 讨论 过 的 所 有 问题 ， 同 时 保留 它 的 好 处 。 


其 实 我 们 有 点 过 分 了 。 静 态 类 型 的 好 处 之 一 就 是 能 选择 更 精确 的 运行 时 表示 。 人 例如， 静态 类 
型 可 以 告诉 我 们 用 的 是 数 是 32 位 的 还 是 64 位 的 甚至 1 位 的 (也 就 是 布尔 值 ) 。 然 后 编译 器 可 以 
利用 位 的 布局 方式 (例如 ，32 个 布尔 值 可 以 屠 包 进 一 个 32 位 字 ) 为 每 种 表示 生成 专用 代码 。 
因此 ， 在 对 每 种 使 用 的 类 型 进行 检查 之 后 ， 多 态 实例 化 程序 可 以 跟踪 函数 或 数据 结构 使 用 时 
用 到 的 特定 类 型 ， 并 将 这 些 信息 提供 给 编译 器 用 于 代码 生成 。 这 会 导致 生成 相关 函数 的 若干 
副本 ， 彼 此 都 互 不 eq? 但 这 么 做 有 充分 的 理由 ， 因 为 它们 要 执行 的 操作 的 确 不 同 ， 所 以 
这 是 正确 的 。 





15.3.1.6 关系 型 参数 

我 们 还 需 解 决 关于 多 态 的 最 后 一 个 细节 。 

早先 我 们 说 过 像 cons 这 样 的 函数 不 依赖 于 其 参数 的 具体 值 。 这 一 点 对 map 、 filter 等 也 成 
立 。 map 和 filter 接收 一 个 函数 作为 参数 ， 当 它们 要 对 单个 元 素 进行 操作 时 ， 实 际 上 使 用 该 


区 数 进行 操作 ， 即 该 函数 负责 做 出 如 何 处 理 元 素 的 决定 ; map 和 filter 本 身 只 是 遵从 该 函数 
参数 。 


“检验 "这 种 情况 是 否 属 实 的 一 种 方法 是 ， 替 换 不 同类 型 的 值 链表 及 对 应 的 函数 作为 参数 。 也 就 
是 说 假设 两 组 值 之 间 有 映射 关系 ; 我 们 根据 此 关系 替换 链表 元 素 和 参数 函数 。 问 题 

是 ，map 和 filter 的 输出 结果 是 否 可 以 通过 该 关系 预测 ? 如 果 对 于 某 些 输入 ， map 的 输出 
和 关系 预测 的 结果 不 同 ， 这 说 明 map 肯定 侦 测 了 实际 值 并 根据 相关 信息 做 出 了 处 理 。 但 事实 
上 ， 这 不 会 发 生 在 map 上 ， 或 者 说 实际 上 也 不 会 发 生 在 大 多 标准 多 态 函 数 上 。 


遵从 这 类 型 关系 准则 的 函数 被 称 为 关系 型 参数 (Relational Parametricity) 【注释 】。 这 是 类 
型 赋予 我 们 的 另 一 个 非常 强大 的 能 力 ， 因 为 它们 告诉 我 们 这 种 多 态 函 数 可 以 执行 的 操作 很 受 
限制 : 它们 可 以 删除 、 复 制 或 重新 排列 元 素 ， 但 是 不 能 考察 这 些 元 素 ， 也 不 能 对 它们 进行 具 
体操 纵 。 


请 参阅 Wadler 的 《Theorems for Freel》 和 Reynolds 的 《Types, Abstraction and 
Parametric Polymorphism》 。 


起 初 这 听 起 来 非常 令 人 印象 深刻 (确实 如 此 ! ) ， 但 细 查 ， 你 可 能 会 意识 到 这 与 经 验 并 不 一 
致 。 例 如 ， 在 Java 中 ， 多 态 方法 依然 可 以 使 用 instanceof 在 运行 时 检查 、 获 得 特定 类 型 的 
值 ， 并 相应 的 改变 行为 。 这 种 方法 就 不 是 关系 型 参数 了 ! 【注释 】 事 实 上 ， 关 系 型 参数 也 能 
被 看 作 是 语言 弱点 的 一 种 表述 : 它 只 允许 一 组 有 限 的 操作 。 (你 仍 可 以 检查 类 型 一 一 但 不 能 
根据 你 获取 的 信息 进行 相关 行动 ， 这 样 检查 就 没有 意义 了 。 因 此 运行 时 系统 如 果 想 要 模拟 关 
系 型 参数 ， 必 须要 移 除 类 似 instanceof 及 它 的 替代 行为 : 例如 ， 对 值 进行 加 一 操作 并 捕获 弄 
常 以 判断 它 是 数 。) 然而 ， 这 是 个 非常 优雅 和 令 人 吃惊 的 结果 ， 显 示 了 使 用 丰富 类 型 系统 能 
获得 的 强大 程序 推理 能 力 。 


天 这 


网 上 ， 你 会 经 常 发 现 这 个 属性 被 描述 为 函数 不 能 检查 其 参数 这 是 不 正确 的 。 





15.3.2 类 型 推断 


手工 书写 每 处 多 态 类 型 的 实例 参数 是 一 个 令 人 沁 吕 的 过 程 ， 很 多 版 本 的 Java 和 C++ 用 户 可 以 
证 明 这 点 。 想 得 一 下 ， 每 次 使 用 first 和 rest 时 都 需要 传 入 类 型 参数 是 个 什么 场景 ! 我 们 之 
所 以 能 够 避免 这 种 命运 ， 是 因为 我 们 的 语言 实现 了 类 型 推断 。 这 使 我 们 可 以 编写 定义 : 


(define (mapper f 1) 
(cond 


[(empty? 1) empty] 
[(cons? 1) (cons (f (first 1)) (mapper f (rest 1)))])) 


然后 编程 环境 自动 声明 


> mapper 
- (('a -> 'b) (listof 'a) -> (listof 'b)) 


它 不 仅 是 正确 的 类 型 ， 而 且 是 非常 一 般 的 类 型 | 从 程序 结构 中 派生 出 这 种 一 般 类 型 的 过 程 感 
觉 几乎 就 是 魔法 。 我 们 来 揭示 其 幕后 。 


首先 ， 我 们 来 了 解 类 型 推断 做 了 什么 。 有些 人 错误 的 认为 ， 有 类 型 推断 的 语言 无 类 型 声明 ， 

其 被 类 型 推断 取而代之 了 。 这 混淆 了 多 个 层面 的 东西 。 首 先 ， 即 使 在 有 类 型 推断 的 语言 中 ， 
程序 员 仍 被 允许 声明 类 型 (并 且 为 了 文档 更 为 清晰 ， 通 常会 鼓励 这 样 做 一 一 就 像 你 之 前 被 鼓 
励 的 一 样 ) 【注释 】。 此 外 ， 在 没有 这 些 声 明 的 情况 下 ， 推 断 的 实际 含义 并 不 显明 。 





有 时 (类 型 ) 推断 是 不 可 判定 的 ， 这 时 程序 员 别 无 选择 只 能 声明 某 些 类 型 。 最 后 ， 显 式 
的 书写 类 型 注解 能 够 大 大 减少 难以 辨认 的 错误 信息 。 





相反 ， 最 好 将 底层 语言 看 作 需 要 完整 地 显 式 声 明 类 型 的 一 一 就 如 我 们 刚才 研究 的 多 态 语 言 。 
然后 我 们 说 ， 在 : 后 类 型 注解 部 分 可 以 留 空 ， 编 程 环境 中 的 某 个 特性 会 为 我 们 炬 充 这 些 。 
(如 果 走 得 更 远 ， 我 们 可 以 丢弃 : 及 额外 的 修饰 ， 它 们 都 会 被 自动 插入 。 因 此 ， 类 型 推断 只 
是 为 用 户 提供 的 一 种 便利 ， 减 轻 编 写 类 型 注解 的 负担 ， 而 底层 的 语言 仍然 是 显 式 声明 类 型 
的 。 


我 们 怎么 考虑 类 型 推断 做 的 是 什么 呢 ? 假设 我 们 有 个 表达 式 (或 者 程序 ) e ， 由 显 式 声明 类 
型 语言 书写 : 也 就 是 说 在 任何 需要 类 型 注解 的 地 方 都 有 写 出 。 现 在 假设 我 们 擦 除 e 中 所 有 的 
类 型 注解 ， 然 后 使 用 函数 infer 将 它们 推断 回来 。 


思考 题 
infer 应 该 有 何 种 属性 ? 


我 们 可 以 要 求 很 多 东西 。 其 中 之 一 为 ， 它 要 产生 和 e 原来 恰好 一 样 的 注解 。 这 在 很 多 方面 都 
是 有 问题 的 ， 尤 其 是 当 e 本 就 不 能 通过 类 型 检查 的 情况 下 ， 怎 么 能 推断 回 它们 (应 该 ) 是 什 
么 ?你 可 能 觉得 这 是 个 学 完 式 的 玩笑 : 本 就 不 能 通过 类 型 检查 ， 如 果 能 在 删除 
其 注解 之 后 还 能 还 原 回来 呢 ? 反正 两 者 都 不 能 通过 类 型 检查 ， 谁 在 平 啊 ? 


思考 题 
这 个 推理 正确 吗 ? 
假设 e 是 : 


(lambda ([x : number]) : string x) 


它 显 然 不 能 通过 类 型 检查 。 但 是 如 果 我 们 擦 除 类 型 注解 一 一 得 到 


(lambda (x) x) 


一 一 这 个 函数 显然 可 以 合法 地 添加 类 型 | 因此 ， 更 合理 的 需求 可 以 是 ， 如 果 原 始 的 e 能 通过 
类 型 检查 ， 那 么 对 应 的 使 用 了 推导 出 的 注解 的 版 本 也 必须 能 。 0 
两 方面 : 


1， 它 没有 说 e 未 通过 类 型 检查 应 该 怎样 ， 也 即 它 不 会 排除 前 述 的 类 型 推断 算法 ， 其 会 将 例 
子 中 类 型 错误 的 恒 等 函 数 变 成 类 型 正确 的 。 


2.， 更 重要 的 是 ， 它 向 我 们 保证 ， 使 用 类 型 推断 将 不 会 使 我 们 失去 任何 东西 : 之 前 能 通过 类 
型 检测 的 程序 不 会 被 推断 后 而 不 能 。 这 意味 着 我 们 可 以 在 想 要 的 地 方 显 式 添加 类 型 注 
解 ， 但 不 会 被 迫 这 样 做 。 

当然 ， 这 只 在 程序 推断 可 判定 的 情况 下 才 成 立 。 


我 们 还 可 能 希望 两 者 类 型 是 相同 的 ， 但 这 不 是 能 做 到 的 : 函数 


(lambda ([x : number]) : number x) 


类 型 为 (number -> number) ， 而 擦 除 类 型 注解 后 推导 出 的 类 型 要 一 般 得 多 。 因 此， 将 这 些 类 
型 关联 并 给 出 类 型 相等 的 定义 并 不 简单 ， 尽 管 如 此 后 面 将 简要 讨论 此 问题 。 


有 了 这 些 准 备 ， 我 们 下 面 进入 对 类 型 推断 机 制 的 研究 。 最 需要 注意 的 地 方 ， 前 述 的 简单 递归 
下 降 的 类 型 检查 算法 将 不 再 起 作用 。 它 之 前 能 起 作用 ， 是 因为 所 有 函数 的 边界 处 都 有 类 型 注 
解 ， 所 以 我 们 下 降 进入 函数 体 ， 同 时 用 类 型 环境 携带 这 些 注解 中 包含 的 信息 。 没 了 这 些 注 
解 ， 就 不 知 如 何 递归 下 降 了 。 


事实 上 ， 目 前 还 不 清楚 哪个 方向 更 合理 。 像 上 面 mapper 的 定义 ， 各 代码 段 之 间 互 相 影 响 。 例 
如 ， 从 empty? 、 cons? 、 first 和 rest 对 1 的 调用 都 可 以 看 出 它 是 链表 。 但 是 是 什么 的 链 
表 呢 ? 从 这 些 操作 看 不 出 来 。 然 而 ， 对 于 其 每 个 〈 或 者 应 该 说 ， 任 意 ) first 元 素 调用 

了 f 这 点 可 以 看 出 ， 链 表 成 员 的 类 型 必须 可 以 被 传 给 f 。 同 理 ， 由 empty 和 cons 我 们 可 以 
知道 ( mapper 的 ) 返回 表达 式 必 须 为 链表 。 它 的 成 员 类 型 是 什么 呢 ? 必须 为 f 的 返回 类 

型 。 最 后 ， 请 注意 最 微妙 的 地 方 : 当 参 数 链表 为 空 时 ， 我 们 返回 empty 而 不 是 1 (这 时 我 们 
是 知道 其 被 绑 定 到 empty ) 。 使 用 前 者 ， 返 回 值 的 类 型 可 能 是 任意 类 型 的 链表 ( 仅 受 Ff 返回 
类 型 的 约束 ) ; 使 用 后 者 ， 返回 的 类 型 就 被 迫 和 参数 链表 的 类 型 相同 。 


所 有 这 些 信息 都 包含 在 函数 里 。 但 是 我 们 如 何 系统 地 提取 出 这 些 信息 呢 ， 而 且 使 用 的 算法 必 
须 会 终止 ， 并 满足 前 面 陈述 属性 ? 我 们 分 两 步 来 做 。 首 先 ， 根 据 程序 表达 式 生成 其 必须 要 满 
足 的 类 型 约束 。 然 后 ， 通 过 合并 散布 在 函数 体 各 处 的 约束 、 识 别 其 中 的 不 一 致 ， 最 终 解 决 约 
束 。 每 一 步 都 相对 简单 ， 但 是 组 合 起 来 创造 了 魔力 。 


15.3.2.1 约束 生成 


我 们 最 终 的 目标 是 给 每 个 类 型 注解 位 置 填 入 类 型 。 将 会 证 明 ， 这 也 等 同 于 找到 每 个 表达 式 的 
类 型 。 简 单 想 想 就 知道 ， 这 本 来 也 是 必要 的 : 比如 ， 在 不 知道 函数 体 类 型 的 情况 下 ， 如 何 能 
确定 函数 本 身 的 类 型 ? 这 也 是 足够 的 ， 因 为 如 果 每 个 表达 式 的 类 型 都 被 计算 得 出 ， 其 中 必然 
包括 了 那些 需要 被 注解 的 表达 式 。 


首先 ， 我 们 需要 生成 ( 待 解决 的 ) 约束 。 这 一 步 会 遍历 程序 源码 ， 为 每 个 表达 式 生成 恰当 的 
约束 ， 最 后 返回 这 组 约束 。 为 了 简单 ， 使 用 递归 下 降 的 方式 实现 ; 它 最 终生 成 约束 的 集合 ， 
所 以 原则 上 遍历 和 生成 的 顺序 是 无 关 紧 要 的 因此 我 们 选择 了 相对 简单 的 递归 下 降 方 式 
一 一 当然 ， 为 了 简单 起 见 ， 我 们 使 用 链表 表示 这 个 集合 。 





约束 是 什么 呢 ? 就 是 关于 表达 式 类 型 的 陈述 。 此 外 ， 虽 然 变 量 绑 定 并 不 是 表达 式 ， 但 我 们 仍 
需 计算 其 类 型 (因为 函数 需要 参数 和 返回 值 类 型 ) 。 一 般 来 说 ， 对 于 表达 式 的 类 型 我 们 知道 
些 


1， 它 和 某 些 标识 符 的 类 型 有 关 。 

2.， 它 和 某 些 其 它 表 达 式 的 类 型 有 关 。 

3. 它 是 数 。 

4， 它 是 函数 ， 其 定义 域 (domain ) 和 值 域 (range) 类 型 可 能 受到 进一步 的 约束 。 


因此 ， 我 们 定义 如 下 两 个 数据 结构 : 


(define-type Constraints 
[eqCon (lhs : Term) (rhs : Term)]) 


(define-type Term 
[tExp (e : ExprC)] 
[tvVar (s : symbol)] 
[tNum] 
[tArrow (dom : Term) (rng : Term)]) 


接 下 来 定义 约束 生成 函数 : 
<constr-gen> ::= ;约束 生成 


(define (cg [e : Exprc]) : (listof Constraints) 
(type-case ExprC e 
<constr-gen-numC-case> 
<constr-gen-idC-case> 
<constr-gen-plusC/multC-case> 
<constr-gen-appC-case> 
<constr-gen-lamC-case>)) 


当 表 达 式 为 数 时 ， 唯 一 能 说 的 是 ， 我 们 希望 该 表达 式 的 类 型 为 数 类 型 : 


<constr-gen-numC-case> ::= 


[numC (_) (list (eqCon (tExp e) (tNum)))] 





听 上 去 很 微不足道 ， 但 我 们 不 知道 的 是 ， 其 他 包含 它 的 表达 式 是 什么 。 因 此 ， 某 个 更 大 的 表 
达 式 可 能 会 与 此 断言 这 个 表达 式 的 类 型 必须 是 数 型 一 一 相 矛 盾 ， 从 而 导致 类 型 错误 。 


对 于 标识 符 ， 我 们 只 是 简单 地 说 ， 表 达 式 的 类 型 就 是 我 们 所 期 望 该 标识 符 应 有 的 类 型 : 


<constr-gen-idC-case> ::= 


[idc (s) (list (eqCon (tExp e) (tVar s)))] 


如 果 上 下 文 限制 了 其 类 型 ， 该 表达 式 的 类 型 将 自动 受到 限制 ， 并 且 必 须 与 上 下 文 的 期 望 一 
致 。 


加 法 是 我 们 第 一 个 遇 到 的 上 下 文 约 束 。 对 于 加 法 表达 式 ， 首 先 需要 确保 我 们 生成 〈 并 返回 ) 
其 两 个 子 表 达 式 的 约束 ， 而 子 表 达 式 可 以 是 复杂 的 。 这 两 个 约束 中 ， 我 们 期 望 什么 ? 需要 每 
个 子 表达 式 是 数 类 型 的 。 (如 果 其 中 一 个 子 表 达 式 不 是 数 类 型 的 ， 应 该 导致 类 型 错误 。) 最 
后 ， 我 们 断言 整个 表达 式 的 类 型 为 数 。 


<constr-gen-plusC/multC-case> ::= 


[plusC (1 r) (append3 (cg 1) 
(cg r) 
(list (eqCon (tExp 1) (tNum)) 
(eqCon (tExp r) (tNum)) 
(eqCon (tExp e) (tNum))))] 


append3 是 append 的 三 参数 版 本 。 
multc 的 情况 与 之 相同 ， 区 别 只 在 名 字 上 。 


下 面 我 们 来 看 另外 两 个 有 趣 的 情况 ， 函 数 声 明和 调用 。 两 种 情况 下 我 们 都 需要 生成 和 返回 子 
表达 式 的 约束 。 


在 函数 定义 中 ， 郊 数 的 类 型 是 函数 ("箭头 /arrow”) 类 型 ， 其 参数 类 型 是 形 参 的 类 型 ， 其 返回 
类 型 是 函数 体 的 类 型 。 


<constr-gen-lamC-case> ::= 


[lamC (a b) (append (cg b) 
(list (eqCon (tExp e) (tArrow (tVar a) (tExp b)))))] 


型 约束 。 不 过 ， 我 们 可 以 说 ， 函数 接 


最 终 ， 考 虑 函数 调用 。 我 们 不 能 直接 陈述 函数 调用 的 类 型 约 
受 回 的 类 型 就 是 调用 表达 式 的 类 型 。 


2 大 
六 的 参数 类 型 必须 和 实际 参数 的 类 型 相同 ， 并 且 部 数 返 


<constr-gen-appC-case> ::= 
[appC (f a) (append3 (cg f) 


(cg a) 
(list (eqCon (tExp f) (tArrow (tExp a) (tExp e)))))] 


完成 了 ! 我 们 已 经 完成 约束 的 生成 ; 现在 只 需 解 出 它们 。 


15.3.2.2 使 用 合 一 求解 约束 


求解 约束 的 过 程 也 被 称 为 合 一 unification) 。 合 一 器 的 输入 是 等 式 的 集合 ， 其 中 每 个 等 式 是 
变量 到 项 (term) 的 映射 ， 项 的 数据 类 型 在 上 面 定义 了 。 注 意 到 一 点 ， 我 们 实际 上 有 两 种 变 
量 。 tvar 和 tExp 都 是 “变量 "， 前 者 很 明显 ， 注 意 后 者 同样 也 是 ， 因 为 我 们 需要 求解 此 类 表 
达 式 的 类 型 。( 另 一 种 方式 是 为 每 个 表达 式 引 入 新 的 类 型 变量 ， 但 我 们 仍 需 一 种 方法 确定 这 
些 变 量 与 表达 式 之 间 的 对 应 关系 ， 而 现在 这 已 经 能 通过 对 表达 式 进 行 eq? 操作 自动 完成 了 。 
另外 这 会 产生 大 得 多 的 约束 集 ， 不 好 进行 人 工 检查 。) 


就 我 们 的 目的 而 言 ， 合 一 是 为 了 是 生成 替换 (Substitution ) ， 或 者 说 将 变量 映射 为 不 包含 任 
何 变量 的 项 。 这 听 起 来 应 该 很 耳 熟 : 我 们 有 一 组 联 立 方程 ， 其 中 每 个 变量 都 是 线性 使 用 的 ; 
这 种 方程 组 可 以 使 用 高 斯 消 元 法 求解 。 该 情形 中 ， 我 们 清楚 最 终 可 能 遇 到 缺少 约束 (Under- 
constrained) 或 过 度 约 束 (over-constrained) 的 情况 。 这 种 事情 同样 也 将 发 生 这 里 。 

合 一 算法 会 遍历 约束 集合 。 由 于 每 个 约束 有 两 项 ， 每 个 项 有 四 种 可 能 的 类 型 ， 因 此 有 十 六 种 
情况 需要 考虑 。 幸 运 的 是 ， 我 们 实际 可 以 用 比较 少 的 代码 覆盖 这 十 六 种 情况 。 

算法 从 所 有 约束 的 集合 和 空 替换 开始 。 每 个 约束 都 会 被 处 理 一 次 ， 并 从 集合 中 删除 ， 因 此 原 
则 上 终止 判 据 应 该 非常 简单 ， 但 是 实际 处 理 起 来 还 有 点 小 麻烦 。 随 着 约束 被 处 理 ， 赫 换 集合 
会 逐渐 增长 。 当 所 有 的 约束 都 被 处 理 完 后 ， 合 一 过 程 返 回 最 后 的 替换 集合 。 

对 于 给 定 的 约束 ， 合 一 器 检查 等 式 左边 ， 如 果 它 是 变量 ， 那 么 这 时 它 就 可 以 被 消除 了 ， 合 一 
器 将 该 变量 (等 式 ) 的 右 侧 添加 到 替换 中 ， 为 了 申 正 完成 消除 ， 还 需要 将 替换 集中 所 有 该 变 
量 的 出 现 替 换 成 该 右 侧 。 实 践 中 ， 实 现 需要 考虑 效率 ; 例如 ， 使 用 可 变 值 表 示 这 些 变量 可 以 
避免 搜索 一 替换 过 程 。 然 而 我 们 可 能 需要 进行 回溯 (我 们 在 后 面 确 实 会 需要 ) ， 可 变 值 表示 
也 有 缺点 2 

思考 是 


注意 到 上 面 微妙 的 错误 了 四? 


这 个 微妙 的 错误 是 ， 我 们 说 合 一 器 通过 替换 变量 的 所 有 实例 来 消除 它 。 不 过 ， 我 们 假设 等 式 
右 侧 不 包含 该 变量 的 实例 。 不 然 的 话 ， 我 们 将 得 到 循环 定义 ， 这 将 使 替换 变 得 不 可 能 。 出 于 
这 个 原因 ， 合 一 器 会 进行 出 现 检查 (occurs check) : 检查 某 个 变量 是 否 出 现在 等 式 两 侧 ， 如 
果 是 ， 则 拒绝 合 一 。 
思考 是 

为 造 一 个 其 约束 会 触发 出 现 检 查 的 项 。 


还 记得 @ 吗 ? 


下 面 考虑 合 一 的 实现 。 惯 例 使 用 希腊 字母 9 表示 替换 。 


(define-type-alias Subst (listof Substitution)) 
(define-type Substitution 
[sub [var : Term] [is : Term]]) 


(define (unify [cs : (listof Constraints)]) : Subst 
(unify/9O cs empty)) 


首先 把 简单 的 东西 写 出 来 : 


<unify/0> : := 


(define (unify/9 [cs : (listof Constraints)] [© : Subst]) : Subst 
(cond 

[(empty? cs) 0] 

[(cons? cs) 

(let ([1 (eqCon-lhs (first cs))] 

[r (eqCon-rhs (first cs))]) 
(type-case Term 1 

<unify/0-tVar-case> 
<unify/0-tExp-case> 
<unify/0-tNum-case> 
<unify/0-tArrow-case>))])) 


现在 可 以 实现 合 一 的 核心 了 。 我 们 需要 一 个 辅助 函数 extend-replace ， 其 签名 

为 (Term Term Subst -> Subst) ° 它 将 执行 出 现 检查 如 果 检 查 得 出 没有 环 路 则 扩展 替换 集 
合 ， 并 将 替换 集合 中 所 有 出 现 的 第 一 个 项 〈 第 一 个 参数 ) 替代 为 第 二 个 项 〈 第 二 个 参数 ) 。 
同样 ， 我 们 假设 lookup: (Term subst -> (optionof Term)) 存在 。 


练习 题 
定义 extend-replace 和 lookup ° 


如 果 约 束 等 式 的 左 侧 是 个 变量 ， 我 们 先 在 替换 集合 中 寻找 它 。 如 果 存 在 ， 我 们 将 当前 约束 换 
成 新 的 约束 ; 否则 我 们 扩展 替换 集合 。 


<Unify/9-tVar-case> ::= 


[tvVar (S) (type-case (optionof Term) (lookup 1 9) 
[some (bound ) 
(unify/© (cons (eqCon bound r) 
(rest cs)) 


9)] 
[none () 


(unify/© (rest cs) 
(extend+replace Jr 9))])] 


同样 的 逻辑 也 适用 于 表达 式 的 情况 : 


<Unify/9-tEXp-case> ::= 


[tExp (e) (type-case (optionof Term) (lookup 1 9) 
[some (bound) 
(unify/© (cons (eqCon bound r) 
(rest cs)) 


9)] 
[none () 


(unify/© (rest cs ) 
(extend+replace Jr 9))])] 


如 果 是 基本 类 型 ， 例 如 数 ， 我 们 就 需要 检查 等 式 右边 。 有 四 种 可 能 : 


e。 如 果 是 数 ， 那 么 该 等 式 声 明 类 型 num 等 于 num ， 这 恒 为 监 。 因 此 我 们 可 以 忽略 该 约束 
一 一 它 没 有 告诉 我 们 什么 有 用 信息 继续 检查 剩 下 的 。 当然 ， 首 先 得 解释 为 什么 会 出 
现 这 种 约束 。 显 然 ， 我 们 的 约束 生成 器 不 会 生成 这 种 约束 。 然 而 ， 前 面 替换 集合 的 扩展 





会 导致 这 种 情况 。 事 实 是 实践 中 我 们 会 遇 到 好 几 个 这 种 情况 。 
e。 如 果 是 函数 类 型 ， 显 然 存在 类 型 错误 ， 因 为 数 和 函数 类 型 不 相交 。 同 样 ， 我 们 不 会 直接 
生成 这 样 的 约束 ， 一 定 是 由 先前 的 蔡 代 产生 。 
。 它 可 能 是 两 种 变量 类 型 之 一 。 不 过 ， 我 们 的 约束 生成 器 经 过 了 仔细 的 安排 ， 不 会 将 它们 
放 在 右 侧 。 此 外 ， 替 代 过 程 也 不 会 在 右 侧 引 入 它们 。 因 此 ， 这 两 种 情况 不 会 发 生 。 


于 是 得 出 这 样 的 代码 : 


<unify/O-tNum-case> ::= 


[tNum () (type-case Term r 
[tNum () (unify/© (rest cs) 0)] 
[else (error 'unify "number and something else")])] 


最 后 还 剩 下 六 数 类 型 。 这 里 的 论点 几乎 和 数 类 型 完全 一 样 。 


<unify/0-tArrow-case> ::= 


[tArrow (d r) (type-case Term r 
[tArrow (d2 r2) 
(unify/© (cons (eqCon d d2) 
(cons (eqCon r r2) 


cs)) 
9)] 


[else (error "unify "arrow and something else")])] 
请 注意 ， 我 们 并 没有 严格 地 缩小 约束 集合 ， 因 此 仅 通过 约束 集合 的 大 小 不 足以 判断 这 个 过 程 
会 终止 。 需 要 同时 综合 考虑 约束 集合 的 大 小 以 及 替换 的 大 小 〈 包 括 其 中 变量 的 个 数 ) 。 


上 面 的 算法 非常 通用 ， 不 仅 对 数 和 函数 ， 对 于 各 种 类 型 项 也 都 适用 。 我 们 使 用 数 代 表 各 种 基 
础 类 型 ; 同样 ， 使 用 函数 代表 各 种 构造 类 型 ， 例 如 listof 和 vectorof 。 


pA 


这 就 完成 了 。 合 一 产生 了 替换 。 现 在 我 们 可 以 遍历 这 些 蔡 换 ， 找 到 程序 中 所 有 表达 式 的 类 
， 然 后 插入 对 应 的 类 型 注解 。 有 定理 (这 里 不 证 明 ) 指出 ， 上 面 过 程 的 成 功 意味 着 程序 通 
过 了 类 型 检查 ， 因 此 我 们 无 需 对 该 程序 显 式 地 再 跑 一 遍 类 型 检查 。 


应 位 喘 


六 


过 请 注意 ， 类 型 错误 的 性 质 在 这 里 发 生 了 巨大 变化 。 之 前 ， 我 们 的 递归 下 降 算 法 利用 类 型 
环境 遍历 表达 式 。 类 型 环境 中 的 绑 定 是 程序 员 定义 的 类 型 ， 因 此 可 以 被 当 作 (期 望 的 ) 权威 
的 类 型 规范 (specification) 。 因 此 ， 所 有 的 错误 都 应 归 答 于 表达 式 ， 类 型 错误 的 报告 很 简单 
(而 且 很 好 懂 ) 。 然 而 这 里 ， 类 型 错误 无 法 通知 。 合 一 错误 是 两 个 智能 算法 一 一 约束 生成 和 
全 二 共同 导致 的 ， 因 此 程序 员 不 一 定 能 理解 。 特 别 是 ， 由 于 约束 的 本 质 是 等 式 ， 报 告 的 
错误 位 置 和 “ 引 实 "的 错误 位 置 可 能 相差 其 远 。 因 此 ， 生 成 更 好 的 错误 信息 仍然 是 个 活跃 的 研究 
领域 。 








实践 中 ， 和 工法 会 维护 涉及 到 的 程序 源码 的 元 信息 ， 并 可 能 也 会 保存 合 一 的 历史 ， 以 便 漳 


源 错误 回 源 程序 。 


最 后 ， 请 记 住 ， 约 束 可 能 不 会 精确 指明 所 有 变量 的 类 型 。 如 果 方 程 组 过 度 约 束 ， 可 能 会 有 冲 
突 ， 导 致 类 型 错误 。 如 果 缺 少 约 束 ， 这 意味 着 我 们 没有 足够 的 信息 对 所 有 表达 式 做 出 明确 的 
类 型 声明 。 例 如 ， 对 于 表达 式 (lambda (x) x) ， 没 有 足够 的 约束 指明 x 的 类 型 ， 从 而 无 法 以 
指明 整个 表达 式 的 类 型 。 这 并 非 错误 ; 它 只 是 意味 着 x 可 以 是 任意 类 型 。 换 句 话 说， 该 表达 
式 的 类 型 是 * x 的 类 型 -> x 的 类 型 ", 无 其 它 约束 。 这 些 欠 约束 标识 符 的 类 型 以 类 型 变量 的 方 
式 展示 >» 于 是 上 面 表 达 式 的 类 型 可 以 表示 为 Gra > 


合 一 算法 实际 上 有 个 很 好 的 属性 : 它 能 自动 计算 表达 式 最 通用 的 类 型 ， 也 被 称 为 主 类 型 
(principal type) 。 这 就 是 说 ， 表 达 式 可 以 有 的 任何 实际 类 型 都 可 以 通过 (用 实际 类 型 ) 替换 
推导 出 的 类 型 中 的 类 型 变量 的 得 到 。 这 是 个 异乎 寻常 的 结果 : 没 人 能 生成 比 前 述 算 法 得 出 的 
更 为 一 般 的 类 型 | 


15.3.2.3 Let- 多 态 
很 不 幸 ， 尽 管 这 些 类 型 变量 表面 上 看 和 我 们 之 前 遇 到 的 多 态 有 诸多 相似 之 处 ， 但 它们 并 不 
同 。 考 虑 下 面 的 程序 : 


(let ([id (lambda (x) x)]) 
(if (id true) 
(id 5) 
(id 6))) 


如 果 加 上 显 式 的 类 型 注解 ， 它 能 通 i 
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(if ((id boolean) true) 
((id number) 5) 
((id number) 6)) 





然而 ， 如 果 使 用 类 型 推断 ， 它 将 不 能 通过 类 型 检查 ! 因为 id 中 的 类 型 'a 取决 于 约束 处 
理 的 顺序 一 “要么 和 boolean 合 一 ， 要 么 和 number 合 一 。 对 应 的 ， 那 时 id 的 类 型 要 人 么 

是 (boolean -> boolean) 要 么 是 (number -> number) ° 当 使 用 另 一 个 类 型 调用 id 时 ， 就 会 发 
生 类 型 错误 ! 


[ry 
Ba 
思 
2 
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通过 合 一 推断 出 来 的 类 型 实际 并 不 是 多 态 的 。 这 上 : 将 其 
不 会 使 你 获得 多 态 ! 美 型 变量 可 以 在 下 次 使 用 时 合 一 ， 彼 时 ， 最 终 得 到 的 还 只 是 单 态 函数 。 
有 在 能 芮 正 进行 类 型 变量 实例 化 时 才 会 获得 。 


所 以 在 具有 丨 正 多 态 的 语言 中 ， 约 束 生成 和 合 一 是 不 够 的 。 相 反 ， 像 ML 和 Haskell 这 种 语言 ， 
甚至 我 们 使 用 的 静态 类 型 语言 也 是 ， 都 实现 了 俗称 let- 多 态 的 东西 。 这 种 策略 中 ， 当 包含 类 型 
变量 的 项 在 词法 环境 中 被 缚 定时， 该 类 型 被 自动 提升 为 量化 类 型 。 每 次 使 用 时 ， 该 项 被 自动 
实例 化 。 


很 多 实现 策略 可 以 做 到 这 点 。 最 简单 (而 不 令 人 满意 ) 的 方式 只 需 复制 绑 定 标识 符 代 码 的 代 
码 ;这样 ， 上 面 每 次 id 的 使 用 都 会 得 到 自己 的 (lambda (x) x) 副本 ， 所 以 每 个 都 有 它 自己 


的 类 型 变量 。 第 一 个 的 类 型 可 能 是 L172; 第 二 个 是 Lp 第 三 个 


是 ('c -> 'c) ， 等 等 。 这 些 类 型 变量 互 不 冲突 ， 因 此 我 们 得 到 多 态 的 效果 。 显 然 ， 这 不 仅 增 
加 了 程序 的 大 小 ， 而 且 在 存在 递归 的 情况 下 也 不 起 作用 。 然 而 ， 这 给 我 们 提供 了 通 往 更 好 解 
决 方案 的 思路 : 不 是 复制 代码 ， 而 是 复制 类 型 。 因 此 在 每 次 使 用 时 ， 我 们 创建 推导 出 类 型 的 
重 命名 版 本 : 第 一 次 使 用 时 ，id 的 类 型 ('a -> 'a) 变 成 了 ('b -> 'b) ， 以 此 类 推 ， 这 种 方式 
实现 了 拷贝 代码 相同 的 效果 且 没 有 它 的 包 补 。 不 过 ， 因 为 这 些 策略 实质 都 是 效仿 代码 拷贝 ， 
因此 它们 只 能 在 词法 环境 下 工作 。 


15.3.3 联合 类 型 


假设 我 们 要 建立 动物 园 动物 的 链表 ， 动 物 有 这 些 种 类 : 独 狼 、 红 尾 师 等。 目前 ， 我 们 必须 创 
建新 的 数据 类 型 : 


(define-type Animal 
[armadillo (alive? : boolean)] ; 独 狂 
[boa (length : number)]) i; 昭 


“在 德州 ， 马 路 中 间 除 了 黄 线 和 死 掉 的 犯 狐 什么 都 没有 。” 一 一 Jim Hightower 


然后 创建 它 的 链表 * (listof Animal) ° 因此 ， Animal 类 型 表示 的 是 armadillo 和 boa 的 “ 联 
合 (或 称 联合 体 ，union ) ”， 不 过 要 创建 这 种 联合 的 唯一 方式 是 每 次 都 创建 新 类 型 : 比如 要 创 
建 动物 和 植物 的 联合 ， 就 需要 : 


(define-type LivingThings 
[animal (a : Animal)] 
[plant (p : Plant)]) 


这 样 实际 的 动物 现在 衷 在 了 更 深 一 " 层 "。 这 些 类 型 被 称 为 带 标签 的 联合 (tagged union ) 或 可 
辨识 的 联合 (discriminated union ) ， 因 为 我 们 需要 显 式 引入 类 似 animal 和 plant 的 标签 

(或 称 辨 识 符 (discriminator)) 来 区 分 它们 。 相 应 地 ， 结 构 体 只 能 通过 数据 类 型 声明 来 定义 ; 
要 创建 只 包含 一 种 变 体 的 数据 结构 ， 如 


(define-type Constraints 
[eqCon (lhs : Term) (rhs : Term)]) 


来 表示 该 数据 结构 我 们 需要 使 用 类 型 constraints 而 不 是 eqCons ， 因为 eqCons 不 是 类 


型 ， 只 是 能 在 运行 时 区 分 的 类 型 变 体 。 


无 论 哪 种 方式 ， 联 合 类 型 的 要 点 是 表示 析 取 或 “或 "。 值 的 类 型 是 联合 中 某 个 类 型 。 值 通常 只 能 


是 联合 中 某 个 特定 的 类 型 ， 不 过 这 取决 于 联合 类 型 的 精确 定义 、 规 范 它们 的 规则 等 等 。 


15.3.3.1 作为 类 型 的 结构 体 


对 此 自然 的 反应 可 能 是 ， 为 什么 不 移 除 这 种 限制 ?为 什么 不 允许 每 个 结构 体 独 立 存在 ， 将 类 
型 定义 为 一 些 结构 体 的 集合 ? 毕竟 ， 不 管 是 C 还 是 Racket， 程 序 员 都 可 以 定义 独立 的 结构 体 ， 
无 需 使 用 标签 构造 函数 将 它们 包 庄 在 其 它 类 型 里 ! 例如 ，Racket 里 可 以 写 : 


pA 


-> 


(struct armadillo (alive?)) 
(struct boa (length)) 


加 个 注释 : 


;; 动物 是 下 面 两 者 之 一 : 
;; - (armadillo <boolean>) 
;; - (boa <number>) 


但 是 由 于 Racket 不 强制 静态 类 型 ， 这 种 比较 不 太 清 楚 。 然 而 ， 我 们 可 以 和 Typed Racket (内 
置 与 DrRacket 中 的 静态 类 型 Racket) 相 比 较 。 下 面 是 对 应 的 静态 类 型 代码 : 


#Lang typed/racket 


(struct: armadillo ([alive? : Boolean])) 
(struct: boa ([length : Real])) ;; feet 


无 需 引 用 armadillo 就 可 以 定义 使 用 boa 类 型 值 的 函数 : 


;; http://en.wikipedia.org/wiki/Boa constrictor#Size_and_ weight 
(define: (big-one? [b : boal) : Boolean 
(> (boa-length b) 8)) 


事实 上 ， 如 果 调 用 此 函数 时 传 入 其 它 类 型 ， 
如 armadillo (big-one? (armadillo true)) 一 一 将 发 生 静 态 错误 © 
为 armadillo 和 boa 之 间 的 关系 等 同 与 数 和 字符 串 之 间 的 关系 。 





当然 ， 我 们 仍 可 以 定义 这 些 类 型 的 联合 : 


(define-type Animal (U armadillo boa) ) 


(define: (safe-to-transport? [a : Animal]) : Boolean 
(cond 
[(boa? a) (not (big-one? a))] 
[(armadillo? a) (armadillo-alive? a)])) 


之 前 我 们 有 一 种 包含 两 个 变 体 的 类 型 ， 现 在 则 有 三 种 类 型 ， 其 中 两 种 类 型 恰巧 能 方便 的 通过 


联合 定义 第 三 种 。 


15.3.3.2 无 标签 联合 


看 起 来 我 们 好 像 还 需要 辨识 标签 ， 但 并 非 如 此 。 在 支持 联合 类 型 的 语言 中 ， 通 常 这 样 获取 类 
型 构造 器 optionof : 将 期 望 的 返回 类 型 和 用 于 表示 失败 或 者 none 的 类 型 结合 起 来 "例如 ， 
下 面 是 (optionof number) 的 等 价 实现 : 


(define-type MaybeNumber (U Number Boolean) ) 


同时 ， Boolean 本 身 也 可 以 是 True 和 False 的 联合 ， 在 Typed Racket 中 也 确实 如 此 。 
此 ， 选 择 (option) 类 型 更 为 准确 的 模拟 实现 应 该 是 : 


(define-type MaybeNumber (U Number False)) 


更 为 一 般 的 ， 可 以 定义 : 


(struct: none ()) 
(define-type (Maybeof T) (U T none)) 


由 于 由 于 none 是 新 的 、 独 特 的 类 型 ， 不 会 和 其 它 类 型 混淆 ， 因 此 该 定义 适用 于 所 有 类 型 。 它 
提供 给 我 们 与 选择 类 型 相同 的 好 处 ， 且 我 们 的 值 没 有 被 埋 入 深 一 层 的 some 结构 体 ， 而 是 立即 
可 用 。 例 如 member ， 其 Typed Racket 中 的 类 型 是 : 


(All (a) (a (Listof a) -> (U False (Listof a)))) 


如 果 元 素 未 找到 ， member 返回 false ; 否则， 它 将 返回 从 该 元 素 开 始 的 链表 ( 即 2 链表 的 第 
一 个 元 素 是 期 望 的 元 素 ) 。 


> (member 2 (list 1 2 3)) 
'(2 3) 


将 其 转换 为 使 用 Maybeof 实现 ， 可 以 写成 : 


(define: (t) (in-list? [e : t] [1 : (Listof t)]) : (Maybeof (Listof t)) 
(let ([v [member e 1]]) 
(if v 


V 
(none)))) 


如 果 元 素 未 找到 ， 它 将 返回 值 (none) ; 如 果 找 到 了 ， 仍 然 是 返回 链表 : 


> (in-list? 2 (list 1 2 3)) 
'(2 3) 


这 样 就 无 需 从 some 容器 中 取出 链表 。 


15.3.3.3 辨识 无 标签 联合 


将 值 放 入 联合 是 一 码 事 ; 我 们 还 需要 考虑 如 何以 类 型 良好 的 方式 将 值 从 其 中 取出 来 。 在 我 们 
的 类 ML 类 型 系统 中 ， 我 们 使 用 程式 化 的 符号 一 一 我 们 的 语言 中 type-case ，ML 中 的 模式 匹配 
一 来 标识 和 取出 各 部 分 。 具 体 来 说 ， 对 于 代码 : 


(define (safe-to-transport? [a : Animal]) : boolean 
(type-case Animal a 
[armadillo (a?) a?] 
[boa (1) (not (big-one? 1))])) 


在 整个 表达 式 中 a 的 类 型 保持 一 致 。 标 识 符 ae 和 1 分 别 被 绑 定 到 布尔 类 型 和 数 类 型 的 值 
上 ， big-one? 接收 的 就 是 这 些 类 型 ， 而 不 是 armadillo 和 poa 。 换 名 话说 ， big-one? 芒 数 
的 输入 类 型 不 可 以 是 boa ， 因 为 根本 没有 这 样 的 类 型 。 


反之 ， 使 用 联合 类 型 的 话 ， 我 们 确实 有 boa 类 型 。 因 此 ， 我 们 遵守 对 值 进 行 谓 词 操作 将 缩小 
其 类 型 的 原则 。 例 如 ， 在 cond 的 子 句 


[(boa? a) (not (big-one? a))] 


中 尽管 a 的 初始 类 型 为 Animal ， 在 通过 boa? 测试 后 ， 类 型 检查 器 会 将 其 类 型 缩小 

到 boa 的 分 支 ， 这 样 big-one? 调用 得 以 通过 类 型 检查 。 反 过 来 ， 其 在 条 件 表 达 式 剩余 部 分 的 
类 型 不 是 boa 这 里 ， 只 剩 下 armadillo 一 种 可 能 。 这 给 类 型 检查 器 提出 了 更 高 的 要 求 ， 
它 需要 能 测试 并 识别 特定 模式 ( 称 为 条 件 分 割 (if-splitting)) ; 缺 了 这 种 能 力 就 无 法 使 用 联合 类 
型 编程 ; 当然 我 们 可 以 只 识别 类 ML 系统 中 能 识别 的 模式 ， 也 就 是 模式 匹配 、 type-case 。 





15.3.3.4 改造 为 静态 类 型 


毫 不 奇怪 ，Typed Racket 使 用 联合 类 型 。 当 将 现 有 语言 改造 为 静态 类 型 时 ， 它 们 尤其 有 用 ， 
因为 现 有 语言 (如 脚本 语言 中 ) 的 程序 没有 用 类 ML 类 型 系统 的 原则 来 定义 。 这 种 类 型 改造 的 
通用 的 原则 之 一 是 尽 可 能 多 地 静态 捕获 动态 异常 。 当 然 ， 检 查 器 最 终 会 让 一 些 程 序 无 法 通过 
检查 【注释 】， 但 如 果 它 拒绝 太 多 可 以 无 错 运行 的 程序 ， 开 发 者 不 太 可 能 采用 它 。 由 于 这 些 
程序 是 在 没有 考虑 类 型 检查 的 情况 下 编写 的 ， 因 此 类 型 检查 器 需要 以 更 为 激进 的 方式 接受 该 
语言 中 被 认为 合理 的 习惯 用 法 。 


中 有 


除非 它 实 现 了 称 为 软 类 型 (soft typing) 的 有 趣 想 法 : 不 拒绝 任何 程序 ， 而 是 提供 信息 告 


知 程序 中 无 法 通过 类 型 检查 之 处 。 


考虑 下 面 的 JavaScript 函 数 : 


var slice = function (arr, start, stop) { 
var result = []; 
for (var i = 0; i <= stop - start; i++) { 
result[i] = arr[start + i]; 


return result; 


} 


它 读 入 一 个 数组 和 两 个 索引 ， 返 回 这 两 个 索引 之 间 的 子 数组 。 例 


如 ， slice([5，7，11，13]，6，2) 求 得 [5, 7, 11] 。 


在 JavaScript 中 ， 开 发 人 员 在 函数 调用 时 可 以 自由 的 省 略 任意 或 者 所 有 尾部 参数 。 每 个 被 省 略 
的 参数 都 被 赋予 特定 值 undefined ， 如 何 处 理 这 种 情形 完全 由 函数 决定 o 例如， slice 的 典 
型 实现 允许 用 户 省 略 最 后 一 个 参数 ; 下 面 的 定义 


var slice = function (arr, start, stop) { 
if (typeof stop == "undefined") 
stop = arr.length - 1; 
var result = []; 
for (var i = 0; i <= stop - start; i++) { 
result[i] = arr[start + i]; 


return result; 


在 未 给 定 第 三 个 参数 时 自动 返回 到 数组 结尾 的 子 数组 : 因此 slice([5，7，11，13]，2) 返 


en 
在 Typed JavaScript【 注 释 】 中 ， 程 序 员 可 以 通过 为 给 定 参数 指定 类 型 U Undefined 来 显 式 地 
章 明 函数 可 以 接受 更 少 的 参数 ， 此 函数 的 类 型 如 下 : 


Vt: (Array[t] * Int * (Int U Undefined) -> Array[t]) 


由 Arjun Guha 等 人 在 布朗 (大 学 ) 创建 。 参 见 我 们 的 网 站 。 


原则 上 ， 这 意味 着 表达 式 stop - start 存在 发 生 类 型 错误 的 可 能 ， 因 为 Stop 可 能 不 是 数 。 
然而 ， 当 用 户 省 略 该 参数 时 ， 对 stop 的 赋值 正好 将 其 设 为 数 类 型 。 换 和 句 话说 ， 在 所 有 控制 路 
径 上 ， 减 法 发 生前 stop 都 将 是 数 类 型 ， 因 此 该 函数 能 通过 类 型 检查 。 当 然 ， 这 要 求 类 型 检查 
器 能 够 对 控制 流 (条 件 ) 和 状态 (赋值 ) 进行 推断 来 确保 函数 类 型 正确 ; 而 Typed JavaScript 
可 以 做 到 ， 也 因此 能 允许 这 样 的 函数 。 


15.3.3.4 设计 选择 
拥有 联合 类 型 的 语言 中 ， 通 常 有 


。 独立 的 结构 体 类 型 (通常 用 类 表示 ) ， 而 不 是 带 有 变 体 的 数据 类 型 。 
e@ 用 于 表示 特定 类 型 的 特殊 (ad hoc) 结构 体 集合 。 
e@ 哨兵 值 (sentinel value) 表示 失败 。 


将 这 种 风格 的 程序 转换 成 满足 类 ML 类 型 风格 的 非常 费事 。 因 此 ， 许 多 改造 过 来 的 类 型 系统 引 
入 联合 类 型 来 减轻 类 型 化 过 程 的 负担 。 

上 述 三 个 属性 中 ， 第 一 个 相对 中 立 ， 但 是 其 它 两 个 需要 更 多 讨论 。 我 们 以 反 序 依 次 解决 它 
们 。 


e 首先 处 理 哨 兵 值 。 很 多 情况 下 ， 哨 兵 应 该 被 替换 为 异常 ， 但 是 在 很 多 语言 中 ， 抛 出 异常 
的 代价 巨大 。 因 此 开发 者 倾向 于 区 分 申 正 的 异常 情况 一 一 不 应 该 发 生 一 一 和 正常 运行 中 
的 预期 情况 。 检 查 元 素 是 否 属于 链表 发 现 不 存在 的 情况 显然 属于 后 者 〈 如 果 我 们 已 经 知 
道 元 素 是 否 存在 ， 这 个 谓词 判断 就 无 需 进 行 ) 。 在 后 一 种 情况 下 ， 使 用 哨兵 是 合理 的 。 








然而 ， 我 们 需要 认识 到 ， 在 C 程 序 中 ， 未 能 检测 异常 的 哨兵 值 是 错误 一 甚至 安全 缺陷 
一 一 的 常见 原因 。 这 点 很 容 多 解决 。 在 C 中 ， 哨 兵 值 和 普通 返回 值 类 型 相同 〈 或 者 至 少 等 
同 于 类 型 相同 ) ， 而 且 运 行 时 也 没有 检查 。 因 此 哨兵 可 以 被 当 作 合法 的 值 使 用 ， 且 不 会 
出 现 类 型 错误 。 这 就 导致 哨兵 值 6 可 以 被 当 作 分 配 数 据 的 地 址 来 使 用 ， 从 而 导致 系统 崩 
溃 。 与 之 不 同 ， 我 们 的 哨兵 是 站 正 意义 上 的 新 类 型 ， 无 法 用 于 任何 计算 。 观 察 到 前 语言 
中 没有 任何 函数 的 输入 类 型 为 none ， 可 以 推理 出 这 点 。 





。 先 忽略 这 里 贬义 的 “特殊 "一 词 ， 对 一 组 结构 体 进行 不 同 的 分 组 是 否 是 个 好 主意 ? 实际 
就 算 在 遵循 类 ML 规范 的 程序 中 ， 当 程序 员 希 望 刻画 一 个 大 宇宙 \ 的 子 宇宙 时 ， 也 会 出 现 这 
种 分 组 的 情形 。 例 如 ，ML 程 序 员 会 使 用 下 面 的 类 型 


(define-type SExp 
[numSexp (n : number)] 
LStrSsexpn(Cs :Stnungdd 
[emstSsexpr (Ql (Stole SEX 


表示 s-eXxpression。 如 果 有 元 数 希 望 操 作 这 些 项 的 某 个 子 集 ， 上 比如 数 和 数 的 链表 ， 就 必须 
创建 新 的 类 型 ， 然 后 将 值 在 两 种 类 型 之 间 转 换 ， 尽 管 这 两 个 类 型 的 内 部 表示 完全 相同 。 
另 一 个 例子 ， 考 虑 CPS 表 达 式 的 集合 ， 这 显然 是 所 有 可 能 表达 式 的 一 个 子 集 ， 但 如 果 不 
得 不 为 其 创建 新 的 类 型 ， 我 们 将 无 法 对 其 使 用 任何 已 有 的 表达 式 处 理 程序 ， 比 如 解释 


经 
站 5 


Wy 


换 种 说 法 ， 联 合 类 型 似乎 是 我 们 之 前 见 到 的 ML 风格 类 型 系统 的 合理 变种 。 但 是 ， 即 使 在 联合 
类 型 中 仍 有 设计 选择 ， 它 们 都 有 其 后 果 。 例 如 ， 人 允许 类 型 系统 创建 新 联合 类 型 吗 ? 允许 用 户 
定义 (和 命名 ) 联合 吗 ? 也 就 是 说 ， 允 许 表 达 式 


(if (phase-of-the-moon) 
10 
true) 


通过 类 型 检查 吗 (将 创建 类 型 (U Number Boolean) ) ， 还 是 由 于 其 引入 了 之 前 未 命名 并 显 式 
标识 的 类 型 而 将 其 判定 为 类 型 错误 ?Typed Racket 提 供 的 是 前 者 : 它 将 创建 芮 正 的 临时 联 
合 。 对 于 给 现 有 代码 引入 类 型 来 说 ， 这 人 么 做 可 能 更 好 ， 因 为 它 更 加 灵活 。 但 对 于 写 新 代码 来 
说 ， 这 是 否 是 个 好 的 设计 还 并 不 清楚 ， 因 为 并 非 程序 员 期 望 内 的 联合 会 出 现 ， 而且 无 法 避 
免 。 这 给 程序 语言 的 设计 空间 提供 了 一 个 未 被 探索 的 角落 。 


15.3.4 名 义 类 型 系统 与 结构 类 型 系统 


我 们 最 初 的 类 型 检查 器 中 ， 如 果 两 个 类 型 具有 相同 的 结构 ， 则 认为 它们 是 相同 的 。 事 实 上 我 
们 根本 没有 提供 类 型 的 命名 机 制 ， 因 此 不 清楚 有 何 替 代 方 案 。 


现在 考虑 Typed Racket。 程 序 员 可 以 写 


(define-type NB1 (U Number Boolean)) 
(define-type NB2 (U Number Boolean)) 


然后 写 


(define: v : NB1 5) 


(define: (f [x : NB2]) : NB2 x) 


然后 用 v 调用 fF， 即 (f v) : 该 调用 应 该 通过 类 型 检查 吗 ? 


有 两 种 完全 合理 的 解释 。 一 种 是 说 v 被 声明 为 类 型 NB1 ， 与 NB2 名 称 不 同 ， 因 此 应 该 被 当 作 
不 同类 型 ， 所 以 该 调用 应 导致 错误 。 这 种 系统 被 称 为 名 义 的 (nominal) ， 因 为 类 型 的 名 字 对 
于 确定 类 型 是 否 相等 极为 重要 。 


与 之 对 应 ， 另 一 种 解释 是 说 因为 NB1 和 NB2 结构 相同 ， 因 此 开发 者 无 法 写 出 在 这 两 种 类 型 的 
值 上 表现 的 不 同 的 程序 来 ， 所 以 它们 应 该 被 视 为 相同 。【 注 释 】 这 种 类 型 系统 被 称 为 结构 的 
(structural) ， 将 允许 上 面 的 程序 通过 检查 。 (Typed Racket 遵 循 结构 类 型 的 规范 ， 理 由 同 
样 是 减少 导入 现 有 动态 类 型 代码 的 负担 ， 这 些 Racket 代 码 通 常 是 以 结构 解释 为 模型 编写 的 。 
事实 上 ，Typed Racket 中 (f v) 不 仅 能 通过 类 型 检查 ， 而 且 打 印 出 的 返回 类 型 为 NB1 ， 无 

视 f 返回 值 的 类 型 注解 | ) 


如 果 特 别 小 心 ， 你 会 注意 到 被 认为 相同 和 实际 相同 之 间 是 有 区 别 的 。 这 里 不 会 涉及 该 问 
， 但 请 考虑 编译 器 作者 选择 值 的 表示 时 其 影响 是 哈 ， 尤 其 在 允许 运行 时 获取 值 的 静态 


是 
类 型 的 语言 中 。 


名 义 和 结 构 类 型 之 间 的 区 别 在 面向 对 象 语言 中 是 最 常见 的 争议 ， 后 面 将 简要 回顾 这 个 问题 。 
然而 ， 这 里 的 重点 是 要 说 明 这 些 问 题 本 质 上 并 不 关于 "对象 "。 任 何 允 许 命名 类 型 的 语言 
于 程序 员 精 神 健康 的 需要 ， 也 就 是 所 有 的 语言 了 一 -都 要 应 付 此 问题 : 命名 只 是 方便 起 见 ， 
还 是 说 所 选 的 名 字 是 被 认为 是 有 意义 的 ?选择 前 者 导致 结构 类 型 ， 选 择 后 者 导致 名 义 类 型 。 


出 





15.3.5 交叉 类 型 
我 们 刚 探索 了 联合 类 型 ， 很 自然 的 就 会 想到 有 没有 交叉 (intersection ) 类 型 呢 。 确 实 有 。 


如 果 联 合 类 型 指 (该 类 型 的 ) 值 属于 这 个 联合 中 某 个 类 型 ， 交 又 类 型 显然 意味 着 该 值 属于 交 
又 中 的 所 有 类 型 : 合 取 ， 或 “ 且 ”。 这 可 能 看 起 来 很 奇怪 : 值 怎么 可 能 属于 多 种 类 型 呢 ? 


用 具体 例子 回答 ， 考 虑 重 载 函 数 。 例 如 ， 某 些 语言 中 + 即 可 操作 数 ， 也 能 操作 字符 串 ; 传 入 
两 个 数 它 返回 数 ， 传 入 两 个 字符 串 它 返回 字符 串 。 这 种 语言 中 ，+ 的 类 型 应 该 是 什么 呢 ? 不 
是 (number number -> number) ， 因为 那样 它 将 不 能 用 于 字符 串 , 同样 的 原因 ， 也 不 


是 (string string -> string) ° 其 至 它 也 不 是 


(U (number number -> number) 
(string string -> string)) 


因为 + 不 仅仅 是 这 些 函 数 之 一 : 实际 上 它 (同时 ) 是 这 两 者 。 我 们 可 以 认为 其 类 型 是 
((number U string) (number U string) -> (number U string)) 
这 说 明 它 的 每 个 参数 和 返回 值 都 只 能 是 这 两 种 类 型 之 一 ， 而 不 同时 为 两 者 。 但 是 ， 这 样 做 会 
导致 精度 损失 。 
思考 题 
这 种 类 型 以 何 种 方式 损失 精度 ? 


观察 到 ， 对 于 这 个 类 型 ， 所 有 有 函数 调用 的 返回 值 类 型 均 为 (number U string) 。 因 此 ， 对 于 每 
个 返回 值 都 必须 区 分 数 和 字符 串 ， 不 然 我 们 将 得 到 类 型 错误 。 所 以 ， 尽 管 我 们 知道 给 定 两 个 
数 参数 将 返回 数 结果 ， 但 这 种 信息 在 类 型 系统 中 丢失 了 。 


更 巧妙 的 是 ， 这 个 类 型 允许 独立 的 选择 每 个 参数 的 类 型 。 因 此 ， 根 据 该 类 型 ， (+ 3 "x") 也 
是 合法 的 ( 且 其 返回 值 类 型 为 (number U string) ) 。 但 我 们 描述 的 加 法 操作 当然 没有 对 这 组 
参数 定义 过 


因此 描述 这 种 加 法 的 更 为 合适 的 类 型 是 


(^ (number number -> number) 
(string string -> string)) 


et dm 这 允许 函数 用 两 个 数 或 者 两 个 字符 串 进行 调用 ， 

它 的 则 不 允许 。 使 用 两 个 数 调 用 返回 数 类 型 ; 使 用 两 个 字符 串 调用 返回 字符 串 类 型 ; 除 此 
了 。 这 刚好 对 应 于 我 们 期 望 的 重 载 行为 《有 时 也 称 为 特 设 多 态 (ad hoc 
polymorphism)) 。 请 注意 这 只 能 处 理 有 限 数 量 重 载 的 情况 。 


15.3.6 递归 类 型 


学 过 联合 类 型 之 后 ， 值 得 讨论 一 下 我 们 原来 遇 到 过 的 递归 数据 类 型 表达 式 。 如 果 接 受 变 体 作 
为 类 型 构造 器 ， 我 们 可 以 将 递归 类 型 写作 它们 的 联合 吗 ? 例如 就 BTnum 来 说 ， 能 否 将 它 描述 
成 等 价 于 


((BTmt) U (BTnd number BTnum BTnum) ) 


的 类 型 吗 ， 其 中 BTmt 是 零 参 数 的 构造 器 ， 而 BTnd 加 不 过 ， 这 三 个 参数 的 类 型 是 
什么 ?2 按 上 面 所 写 的 类 型 ， BTnum 要 么 是 类 型 内 建 的 (这 不 能 令 人 满意 ) ， 要 么 是 未 线 
定 的 。 也 许 我 们 要 的 是 


BTnum = ((BTmt) U (BTnd number BTnum BTnum)) 


问题 是 这 个 方程 没有 明显 解法 (还 记得 @ 吗 ?) 。 


这 种 情况 我 们 讨论 值 的 北 归 时 就 熟悉 过 。 那 时 ， 我 们 发 明了 递归 函数 构造 器 (并 展示 了 其 实 
现 ) 来 规避 这 个 问题 。 这 里 我 们 同样 需要 递归 类 型 构造 器 。 按 惯例 它 被 称 为 hn (项 腊 字 
母 “ 缪 ") 。 有 了 它 ， 我 们 可 以 将 上 面 的 类 型 写 做 


H BTnum : ((BTmt) U (BTnd number BTnum BTnum) ) 


h 是 绑 定 构造 ; 它 将 BTnum 绑 定 到 后 面 写 的 整个 类 型 上 ， 包 括 对 BTnum 自身 的 递归 绑 定 。 实 
践 中 ， 整 个 递归 类 型 就 是 我 们 希望 得 到 的 称 为 BTnum 的 类 型 : 


BTnum = Hh BTnum : ((BTmt) U (BTnd number BTnum BTnum) ) 


尽管 这 看 起 来 像 是 循环 定义 ， 但 请 注意 ， 右 侧 的 BTnum 不 依赖 于 等 式 左 侧 的 那个 : 即 ， 我 们 
可 以 将 其 重 写 为 


BTnum = HT : ((BTmt) U (BTnd number T T)) 


换 句 话说 ，BTnum 的 这 个 定义 可 以 被 认为 是 语法 糖 ， 可 以 在 程序 的 各 个 地 方 替换 使 用 ， 无 需 
担心 无 限 回 归 的 问题 。 
语义 层面 上 ， 对 | 绑 定 的 类 型 的 意义 有 两 种 截然 不 同 的 思考 方式 : 它们 可 以 被 解释 为 同 构 弟 


归 (isorecursive) 或 等 价 递归 (equirecursive) 。 然 而 其 中 区 别 很 微妙 ， 超 出 了 本 章 范围 
【注释 】 只 需 理 解 递 归 类 型 可 以 被 视 为 等 同 于 它 的 展开 。 例 如 ， 我 们 定义 数 的 链表 类 型 为 


NumL = LT : ((MtL) U (ConsL number T)) 


于 是 有 


WHT: ((MtL) U (ConsL number T)) 
(MtL) U (ConsL number (HT : ((MtL) U (ConsL number TT)))) 
(MtL) U (ConsL number (MtL)) 
U (ConsL number (ConsL number (HT : ((MtL) U (ConsL number T) )))) 


以 此 类 推 ( 同 构 和 等 价 递归 之 间 的 区 别 正 是 在 相等 性 的 概念 上 : 是 定义 上 的 相等 性 还 是 同 构 
意义 上 的 ) 。 每 一 步 中 ， 我 们 将 参数 T 替换 成 整个 类 型 。 和 值 的 递归 一 样 ， 它 的 意思 是 需要 
时 我 们 可 以 “获得 另 一 个 ”consL 构造 。 换 种 说 法 ， 链 表 的 类 型 可 以 写成 零 或 任意 多 元 素 的 联 


合 ; 这 等 价 于 包含 零 个 、 一 个 或 任意 个 元 素 的 类 型 ; 以 此 类 推 。 任 何 数 的 链表 都 (恰好 ) 符 
合 这 些 类 型 。 


Pierce 的 书 中 对 此 解释 的 非常 好 。 
注意 到 ， 即 使 基于 对 于 ph 的 这 种 非 正 式 理解 ， 我 们 已 经 可 以 给 @ 进而 9 提供 类 型 。 
练习 题 


描述 0 和 9 的 类 型 。 


15.3.7 子 类 型 


想象 我 们 有 一 个 典型 的 二 又 树 定义 ; 简单 起 见 ， 我 们 假设 值 为 数 。 使 用 Typed Racket 写 该 定 
Da: 


#lang typed/racket 


(define-struct: mt ()) 
(define-struct: nd ([v : Number] [1 : BT] [r : BT])) 
(define-type BT (U mt nd)) 


考虑 二 又 树 树 具体 的 值 : 


> (mt) 
- :mt 
#<mt> 
> (nd 5 (mt) (mt)) 
= nd 
#<nd> 


注意 每 个 构造 器 构造 出 其 自己 对 应 类 型 的 值 ， 而 不 是 类 型 BT 的 值 。 但 是 考 
d 5 (mt) (mt)) : nd 的 定义 声明 其 子 树 必须 为 BT 类 型 ， 但 是 我 们 可 以 给 它 传递 mt 类 


显然 ， 使 用 mt 和 nd 来 定义 BT 并 不 是 巧合 。 但 是 ， 它 确实 表明 在 进行 类 型 检查 时 ， 不 能 只 
检查 构造 函数 的 相等 性 ， 至 少 对 我 们 目前 有 的 东西 不 行 。 相 反 ， 我 们 必须 检查 一 种 类 型 “适用 
于 " 另 一 种 。 这 种 行为 也 被 称 为 子 类 型 化 (subtyping) 。 


子 类 型 化 的 本 质 定义 一 个 关系 ， 通 常用 <: 表示 ， 它 关联 一 对 类 型 。 当 给 定 类 型 为 s 的 值 
时 ， 那 么 它 同 时 也 是 类 型 T 时 我 们 就 可 以 说 s <: T : 换 句 话说 ， 子 类 型 化 将 可 替代 性 的 概 
念 形式 化 的 表达 出 来 ( 即 ， 任 何 期 望 类 型 T 的 值 的 地 方 ， 都 可 以 被 替换 成 类 型 为 s 的 值 ) 。 
当 该 关系 成 立 ，s 被 称 作 子 类 型 ，T 被 称 作 超 类 型 。 使 用 子 集 去 解释 这 点 是 很 有 用 的 (通常 
也 是 准确 的 ) : 如 果 s 的 值 是 T 的 一 个 子 集 ， 那 么 期 望 接受 类 型 为 T 的 值 的 表达 式 不 应 该 
拒绝 只 接受 s 中 的 值 。 


子 类 型 化 对 类 型 系统 有 着 深远 影响 。 我 们 需要 审视 每 种 类 型 ， 并 理解 它 和 子 类 型 化 之 间 的 相 
互 作用 。 对 于 基本 类 型 ， 这 通常 比较 明显 : 数字 、 字 符 串 等 的 这 种 不 想 交 类 型 ， 彼 此 无 关 
(存在 一 些 语言 ， 使 用 一 种 基本 类 型 表示 其 它 基 本 类 型 一 例如， 某 些 脚本 语言 中 ， 数 只 不 
过 是 特殊 写法 的 字符 串 ， 还 有 些 语言 中 ， 布 尔 值 不 过 就 是 数 一 这些 语言 中 ， 基 本 类 型 之 间 
会 存在 关系 ， 但 是 这 种 情况 并 不 常见 。) 。 但 是 ， 我 们 必须 考虑 子 类 型 化 和 每 个 复杂 类 型 构 
造 器 之 间 的 关系 。 


事实 上 ， 甚 至 我 们 关于 类 型 的 表述 也 需要 改变 。 假 设 我 们 有 一 个 类 型 为 T 的 表达 式 。 通 常 我 
们 会 说 它 产生 类 型 为 T 的 值 。 现 在 ， 我 们 需要 小 心 的 说 它 产 出 的 值 最 多 是 类 型 T ， 因 为 它 可 
能 只 产 出 类 型 T 的 一 个 子 类 型 的 值 。 因 此 每 个 对 类 型 的 引用 都 隐 含 的 笼罩 在 对 可 能 的 子 类 型 
的 引用 中 。 为 避免 纠缠 我 会 控制 不 这 样 做 ， 但 要 小 心 ， 不 把 这 种 隐 含 的 解释 放 在 心 上 可 能 招 
致 推理 错误 。 


15.3.7.1 联合 


让 我 们 来 看 看 联合 和 子 类 型 化 会 发 生 什么 作用 。 显 然 ， 每 个 子 联 合 是 整个 联合 的 子 类 型 。 在 
我 们 之 前 的 示例 中 ， 每 个 mt 类 型 的 值 显 然 也 都 是 BT 的 ; 这 同样 适用 于 nd 。 因 而 ， 


mt <: BT 
nd <: BT 


于 是 ， (mt) 的 类 型 也 为 BT ， 因 此 表达 式 (nd 5 (mt) (mt)) 类 型 良好 ， 且 有 类 型 nd 
此 ， 也 是 类 型 BT 。 一 般 来 说 ， 





(我 们 写 了 两 个 看 上 去 差不多 的 的 规则 ， 这 是 为 了 明确 说 明子 类 型 处 在 联合 中 的 哪 “ 一 边 " 并 不 
重要 ) 。 它 的 意思 是 s 的 值 可 以 被 认为 是 s UT 的 值 ， 因 为 任何 类 型 为 s UT 的 表达 式 都 确 
实 包含 类 型 s 的 值 。 

15.3.7.2 交 又 

既然 到 了 这 一 步 ， 我 们 也 简要 的 看 一 下 交 又 类 型 。 正 如 你 可 能 想象 的 那样 ， 交 又 类 型 表现 出 


双 面 行为 : 


(SAT) <: S 
(SAT) <: T 


方便 起 见 ， 使 用 集合 的 解释 : 如 果 值 即 属于 s 也 属于 TT ， 显 然 ， 它 可 以 是 它们 中 的 任意 类 


型 。 


为 什么 下 面 两 者 无 效 ? 


1. Rem es 


2 


第 一 条 无 效 是 因为 类 型 T 的 值 是 (s U T) 中 完全 合法 的 值 。 例 如 ， 数 是 类 
型 (string U number) 的 一 员 。 然 而 ， 数 不 可 以 在 需要 类 型 为 String 的 时 候 被 使 用 。 


至 于 第 二 条 ， 类 型 T 的 值 一 般 来 说 不 是 类 型 s 的 值 。 任 何 希 望 类 型 (s A T) 消费 者 希望 其 能 
够 既 作 为 T 也 作为 s ， 因 此 这 这 第 二 条 是 不 对 的 。 例 如 ， 给 定 前 面 见 过 的 重 载 的 + ， 如 
果 T 为 (number number -> number) ， 那么 该 类 型 的 函数 无 法 对 字符 串 进 行 处 理 2 


15.3.7.3 函数 


再 看 一 个 类 型 构造 器 : 函数 。 我 们 需要 决定 子 类 型 化 时 ， 其 中 一 个 类 型 可 以 为 函数 的 情况 。 
通常 我 们 认为 函数 和 其 它 类 型 不 相交 ， 因 此 我 们 只 需要 考虑 函数 类 型 作为 另 一 个 函数 类 型 的 
子 类 型 的 情况 : 也 既 ， 何 时 会 满足 下 面 式 子 ? 


(SO => TT < (S23 > 2) 


我 们 也 见 过 参数 化 数据 类 型 。 这 个 版 本 中 ， 对 它们 的 子 类 型 化 的 探索 作为 留 给 读者 的 练 
习 。 


方便 起 见 ， 我 们 称 类 型 (S1 -> T1) 为 f1 ， (S2 -> T2) 为 f2 。 问 题 就 变 成 了 ， 如 果 一 个 表 
达 式 类 型 为 f2 ， 何 种 情况 下 给 安全 的 给 其 传递 f1 类 型 的 函数 ?使 用 子 集 解 释 来 考虑 这 个 问 
题 比 较 容 易 。 


考虑 f2 类 型 的 使 用 。 它 返回 值 的 类 型 为 Tr 2 。 因 此 函数 调用 所 在 的 上 下 文中 所 需 的 值 类 型 应 

该 满足 类 型 7 2 。 显 然 ， 如 果 T1 和 T2 相同 ， 那 么 在 该 上 下 文中 使 用 f2 也 能 通过 类 型 检 

查 ; 类 似 的 ， 如 果 T1 包含 T2 值 的 一 个 子 集 ， 也 是 可 以 的 。 唯 一 的 问题 是 ， 如 果 T1 的 值 
比 T2 多 ， 该 上 下 文 将 可 能 遭遇 非 期 望 的 值 ， 从 而 导致 未 定义 行为 。 换 印 话 说 ， 我 们 需 

要 T1 <: T2 。 注 意 其 中 符号 的 “方向 "与 函数 类 型 中 符号 的 方向 相同 ; 这 被 称 为 协 变 
(covariance， 两 者 在 相同 的 方向 上 变化 ) 。 这 也 许 正 是 你 期 望 的 。 


出 于 同样 的 原因 ， 你 可 能 认为 参数 位 置 也 出 现 协 变 : 即 S1 <: s2 。 能 猜 到 你 会 这 样 想 ， 但 它 
是 错 的 。 让 我 们 看 看 为 什么 。 


对 f2 类 型 的 函数 进行 调用 需要 提供 类 型 为 s2 的 值 的 参数 。 假 设 我 们 将 函数 替换 为 类 

型 f1 的 。 如 果 S1 <: s2 ， 这 意味 着 新 的 函数 仅 接 受 类 型 S1 的 一 个 子 集 中 的 值 一 一 严格 子 
集 。 这 意味 着 对 于 茶 些 值 ， 替换 的 函数 的 行为 是 未 定义 的 ， 这 导致 未 定义 的 行为 。 为 避免 
此 ， 需 要 假定 相反 的 方向 : 即 替代 函数 应 该 至 少 能 接收 原 函 数 能 够 接收 的 那些 值 。 因 此 我 们 
需要 s2 <: S1 ， 我 们 说 该 位 置 是 北 变 (contravariant) 的 : 它 和 子 类 型 化 方向 相反 。 


综合 这 两 个 发 现 ， 我 们 得 到 有 函数 子 类 型 化 的 规则 (对 于 方法 也 一 样 ) 


(S52 < Ss1) and (1T1 <® 12) => (SL => T1) < (S2 :3 12) 


15.3.7.4 实现 子 类 型 


当然 ， 这 些 规则 假定 我 们 已 经 修改 了 类 型 检查 器 遵循 子 类 型 化 的 要 求 。 子 类 型 化 的 本 质 是 
说 ， 如 果 有 一 个 表达 式 e ， 其 类 型 为 s， 且 Ss<:T， 那 么 e 具有 类 型 T。 虽 然 这 听 上 去 
很 直观 ， 但 它 是 有 问题 的 ， 出 于 两 个 原因 : 


。 到 目前 为 止 ， 我 们 所 有 的 类 型 规则 都 是 语法 驱动 的 ， 这 使 我 们 可 以 编写 一 个 递归 下 降 的 
类 型 检查 器 。 但 是 ， 现 在 我 们 有 一 个 适用 所 有 表达 式 的 规则 ， 我 们 不 知道 怎样 去 应 用 这 
条 规则 了 。 

e。 可 能 存在 很 多 级 别 的 子 类 型 。 这 使 得 何 时 "停止 " 子 类 型 化 不 再 是 个 显而易见 的 问题 。 特 别 
是 ， 现 在 表达 式 可 以 有 很 多 可 能 的 类 型 ， 在 类 型 检查 能 计算 出 表达 式 的 类 型 之 前 ; 如 果 
我 们 返回 了 “错误 "的 ， 可 能 会 遇 到 类 型 错误 (因为 它 不 是 上 下 文 期 望 的 类 型 ) ， 尽 管 这 时 
候 可 能 存在 一 些 其 它 的 能 够 满足 上 下 文 需求 的 类 型 。 


这 两 个 问题 指出 的 是 ， 我 们 这 里 给 出 的 关于 子 类 型 化 的 描述 根本 上 来 说 是 声明 性 的 : 我 们 在 
说 它 应 该 是 怎样 的 ， 但 是 没有 将 这 种 说 明 转 换 成 算法 。 对 于 每 个 实际 的 静态 类 型 语言 ， 将 其 
转换 成 算法 的 子 类 型 化 时 总 会 遇 到 多 或 少 被 认为 是 有 趣 的 问题 : 一 种 实现 类 型 检查 器 的 实际 
算法 〈 理 想 情 况 下 ， 该 类 型 检查 器 能 让 所 有 声明 机 制 下 被 认为 是 有 效 的 程序 通过 类 型 检测 ， 
也 即 ， 既 正确 又 完全 ) 。 


15.3.8 对 染 类 型 


早先 我 们 提 到 过 ， 对 象 类 型 通常 分 为 两 个 阵营 : 名 义 的 (nominal) 和 结构 的 (structural) 。 
名 义 类 型 对 于 大 多 数 程序 员 来 说 在 Java 的 学 习 中 应 该 已 经 熟悉 ， 所 以 这 里 不 再 多 说 。 对 象 的 
结构 类 型 是 说 对 象 的 类 型 本 身 就 是 一 个 结构 化 的 对 象 ， 和 包含 字段 的 名 字 及 它们 的 类 型 。 例 
如 ， 有 两 个 方法 add1l 和 sub1 一 -一 的 对 象 ， 其 类 型 将 是 : 





{add1 : (number -> number), subi : (number -> number)} 


(为 方便 引用 ， 我 们 称 这 个 类 型 为 addsub 。) 类 型 检查 的 将 沿 着 可 预见 的 路 径 行进 : 对 于 字 
段 的 访问 ， 我 们 只 需 确保 字段 存在 ， 并 将 该 字段 的 声明 类 型 用 于 它 解 引用 得 到 的 表达 式 上 ; 
对 于 方法 调用 ， 我 们 不 仅 需 要 确保 对 应 成 员 存在 ， 还 要 确保 其 类 型 正确 。 到 目前 为 止 ， 十 分 
简单 。 

对 象 类 型 会 因为 很 多 原因 变 得 十 分 复杂 : 


尽管 有 点 过 时 ， 但 是 Abadi 和 Carelli 的 A Theory of Objects 仍 然 很 重要 ， 因 为 这 整 本 书 都 
专注 于 该 话题 。Bruce 的 Foundationos of Object-Oriented Languages: Types and 
Semantics 更 为 现代 ， 也 提供 了 更 温和 的 阅 述 。Perce 则 漂亮 的 覆盖 了 所 有 必要 的 理论 。 


。 自 引用 。 self 的 类 型 是 什么 ? 它 必须 拥有 和 自己 那个 对 象 相 同 的 类 型 ， 由 于 任何 可 以 


从 "外 部 "施加 到 对 象 上 的 操作 也 可 以 通过 self 在 “内 部 "施加 给 它 。 这 意味 着 对 象 是 递归 

e 访问 控制 : 私有 、 公 共和 其 它 限 制 。 这 导致 对 象 类 型 “外 部 ?和 "内 部 "之 间 的 区 别 。 

e 继承 : 不 仅 需要 为 父 对 象 指定 类 型 ， 还 需要 考虑 继承 路 径 上 哪些 东西 可 见 ， 这 和 "外 部 "可 
见 的 东西 又 有 区 别 。 

e 多 重 继承 和 子 类 型 之 间 的 相互 作用 。 

。 像 Java 这 样 的 语言 中 类 和 接口 之 间 的 关系 存在 运行 时 成 本 。 

e 赋值 。 

。 类 型 转换 。 

。 Snakes ona plane。 


等 等 。 其 中 的 一 些 问题 会 因为 名 义 类 型 而 简化 ， 因 为 给 定 类 型 名 我 们 就 可 以 确定 有 关 其 行为 
的 所 有 信息 (类 型 声明 实际 变 成 了 一 个 字典 ， 从 中 我 们 可 以 查询 关于 对 象 的 描述 ) ， 这 也 是 
赞成 名 义 类 型 的 一 个 论据 。 


注意 Java 的 方法 不 是 构建 名 义 类 型 系统 的 唯一 方法 。 我 们 已 经 讨论 过 ，Java 的 类 系统 不 
必要 的 限制 了 程序 员 的 表达 能 力 ; 相对 的 ，Java 的 名 义 类 型 不 必要 的 将 类 型 (接口 描 
述 ) 和 实现 混为一谈 。 因 此 ， 是 可 以 有 上 比 Java 中 的 好 得 多 的 名 义 类 型 系统 的 。 例 如 ， 
Scala 在 这 个 方向 上 到 出 了 一 些 很 重要 的 步子 。 


对 这 些 问 题 进行 充分 论述 需要 在 更 大 的 设计 空间 中 讨论 。 现 在 我 们 限制 自己 到 一 个 有 趣 的 问 
题 。 记 得 我 们 说 过 子 类 型 化 迫使 我 们 考虑 每 个 类 型 构造 器 吗 ? 对 象 的 结构 类 型 要 再 引入 一 
类 : 对 象 类 型 构造 器 。 因 此 我 们 必须 了 解 它 与 子 类 型 化 之 间 的 相互 作用 。 


在 那 之 前 ， 让 我 们 确保 我 们 理解 对 象 类 型 到 底 意 味 着 什么 。 考 虑 上 面 的 addsub 类 型 ， 其 中 列 
举 了 两 个 方法 。 何 种 对 象 可 以 给 定 此 类 型 ? 显然 ， 恰 好 拥有 这 两 个 方法 且 类 型 符合 的 对 象 才 
符合 条 件 。 同 样 明 显 的 是 ， 如 果 一 个 对 象 只 包含 这 两 个 方法 中 的 一 个 ， 不 管 它 还 包含 有 其 它 
什么 ， 都 不 符合 条 件 。 其 中 短语 “不管 它 还 包含 其 它 什 么 "是 要 强调 的 。 如 果 对 象 表示 的 是 算术 
包 ， 除 了 这 两 个 方法 之 外 ， 它 还 包含 + 和 * 呢 ? 这 种 情况 下 ， 我 们 当然 得 到 了 一 个 能 供应 上 
面 两 个 方法 的 对 象 ， 因 此 该 算术 包 确 实 有 类 型 addsub 。 不 过 将 其 作为 类 型 addsub 使 用 时 ， 
其 它 方 法 应 该 不 可 用 。 


下 面 我 们 写 下 这 个 包 的 完整 类 型 2 称 之 为 asS+* 


{add1i : (number -> number), 
Sub1 : (number -> number), 
二 : (number number -> number), 
: (number number -> number )} 


前 面 讨论 过 了 类 型 as+r* 的 对 象 应 该 也 允许 被 声明 称 类 型 addsub ， 这 意味 着 它 可 以 替换 到 在 
上 下 文中 期 望 是 addsub 类 型 的 值 。 换 和 句 话 说， 我 们 刚才 的 意思 其 实 是 as+t* <: addsub : 


{add1i : (number -> number), {add1 : (number -> number), 


Sub1 : (number -> number), <: Sub1 : (number -> number)} 
+ : (number number -> number), 
名 : (number number -> number )} 


这 可 能 年 一 看 令 人 困惑 : 我 们 说 过 子 类 型 化 遵从 集合 包含 关系 ， 因 此 我 们 期 望 小 的 集合 在 左 
侧 而 大 的 集合 在 右 侧 。 可 这 里 ， 好 像 “ 大 的 类 型 ” (至少 在 字符 数量 的 意义 上 是 ) 在 左 侧 而 “小 
的 类 型 "在 右 侧 。 


为 了 理解 为 什么 这 是 正确 的 ， 发 展 出 类 型 “ 越 大 ”， 其 包含 的 值 越 少 这 种 直觉 会 很 有 帮助 。 左 侧 
的 每 个 对 象 都 含有 四 个 方法 ， 而 且 其 中 包含 了 右 便 的 那 两 个 方法 。 但 是 ， 有 很 多 对 象 有 右 侧 
的 两 个 方法 ， 但 是 不 包含 左 侧 那 另 外 的 两 个 方法 。 如 果 我 将 类 型 看 作对 可 接受 值 形状 的 约束 
的 话 ，“ 更 大 ”的 类 型 表明 它 给 定 了 更 多 约束 ， 因 此 会 导致 更 少 的 值 。 这 样 ， 尽 管 类 型 可 能 看 上 
去 大 小 关系 不 对 ， 但 是 它们 所 包含 的 值 的 集合 的 大 小 关系 是 正确 的 。 


更 一 般 地 ， 从 对 象 中 删除 字段 ， 我 们 将 获得 超 类 型 。 这 被 称 为 宽度 子 类 型 化 《width 
subtyping) ， 因 为 子 类 型 更 宽 "， 我们 通过 调整 对 象 “宽度 i 。 我 们 甚至 
可 以 在 名 义 类 型 的 Java 世 界 中 看 到 这 点 : 当 沿 着 继承 链 上 漳 时 ， 类 中 的 方法 和 字段 越 来 越 

少 ， 直 到 object ， 它 是 所 有 类 的 超 类 型 ， 其 中 包含 最 少 的 字段 和 方法 。 因 此 对 于 Java 中 的 任 
意 类 类 型 C ， 满 足 C <: Object ° 


正如 你 期 望 的 那样 ， 还 有 一 种 重要 的 子 类 型 形式 ， 在 给 定 成 员 内 部 。 就 是 说 任何 特定 的 成 员 
都 可 以 归 入 相应 位 置 的 超 类 型 。 处 于 显而易见 的 原因 ， 这 种 形式 的 子 类 型 化 被 称 为 深度 子 类 
型 化 (depth subtyping) 。 


有 时 ， 缩 小 (narrowing) 和 拓宽 (widening) 的 使 用 方式 会 让 人 疑惑 ， ， 
反 了 一 样 。 拓 宽 是 指 从 子 类 型 转 到 超 类 型 ， 因 为 它 是 从 一 个 “ 较 窜 "( 较 小 ) 的 集合 到 一 
个 “ 较 宽 ”( 较 大 ) 的 集 含 。 这 些 术 语 是 独立 演化 而 来 的 ， 很 不 幸 ， 并 不 一 致 。 


练习 题 


构造 两 个 深度 子 类 型 化 的 例子 。 其 中 一 个 ， 给 定 字段 为 对 象 类 型 ， 使 用 宽度 子 类 型 化 去 
取 该 字段 的 子 类 型 。 另 一 个 例子 中 ， 给 定 字段 为 函数 类 型 。 


Java 中 限制 了 深度 子 类 型 化 ， 它 倾向 于 类 型 在 对 象 层次 结构 中 保持 不 变 ， 因 为 这 对 传统 的 赋 
值 操作 来 说 是 安全 的 。 


宽度 和 深度 子 类 型 化 的 结合 包含 了 对 象 子 类 型 化 中 大 部 分 最 有 趣 的 情形 。 然 而 ， 仅 实现 这 两 
个 子 类 型 化 的 类 型 系统 会 不 必要 的 招致 程序 员 的 恼火 。 其 它 方便 的 (而且 数学 上 必须 的 ) 规 
则 还 包括 可 以 排列 名 称 的 能 力 、 反 身 性 (每 个 类 型 是 其 自己 的 子 类 型 ， 因 为 将 子 类 型 关系 解 
释 为 < 很 方便 ) 和 传递 性 。 类 似 Typed JavaScript 的 语言 使 用 了 所 有 这 些 特性 为 程序 员 提 供 
最 大 的 灵活 小 性 。 


15. 静态 地 检查 程序 中 的 不 变量 : 类 型 
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16 动态 地 检查 程序 中 的 不 变量 : 四 约 


类 型 系统 提供 丰富 且 有 价值 的 方式 来 表示 程序 不 变量 。 (这 两 句 请 校对 修改 ) 然而 ， 它 们 也 
代表 了 一 个 重要 的 权衡 ， 因 为 并 非 所 有 程序 的 非 平凡 属性 都 可 以 被 静态 验证 。 【注释 】 此 

外 ， 即 使 某 个 属性 可 以 设计 静态 方法 解决 ， 注 释 和 计算 复杂 度 的 负担 也 可 能 过 大 。 因 此 ， 我 
们 所 关心 的 一 些 属 性 不 可 避免 地 只 能 被 忽略 或 在 运行 时 解决 。 本 章 我 们 来 讨论 运行 时 检查 不 


变量 。 
这 是 一 个 形式 上 的 属性 ， 被 称 为 赖 斯 定理 。 


实际 上 ， 每 种 编程 语言 都 包含 某 种 形式 的 断言 机 制 ， 使 程序 员 能 够 编写 比 语言 的 静态 类 型 系 
所 所 许 的 二 的 性 。 在 有 和 大红 多 请 让， 这 此 可 能 以 和 的 区 开 
始 : 例如 ， 某 个 参数 是 否 为 数 。 然 而 ， 断 言语 言 通常 是 整个 a ， 因此 任何 谓词 都 可 以 
用 作 断 言 : 例如 ， 某 个 加 密 包 的 实现 可 能 希望 确保 某 些 参数 过 洒 数 汕 江 4 或 者 茶 个 平衡 二 
又 搜索 树 可 能 想 要 确保 其 子 树 确实 是 平衡 且 有 序 的 。 


是 
此 


16.1 以 回 约 实现 谓词 


因此 很 容易 想到 如 何 实现 简单 的 契约 〈contract) 。【 注 释 】 加 约 实现 了 谓词 。 它 读 入 一 个 值 
并 将 谓词 应 用 于 该 值 。 如 果 值 能 通过 谓词 ， 则 回 约 原样 返回 该 值 ; 如 果 不 能 ， 则 Ae 
错误 。 其 行为 只 能 是 返回 原 值 或 报错 : 它 不 应 以 任何 方式 更 改 值 。 简 而 言 之 ， 对 于 能 谓 
词 的 值 ， 契 约 本 身 就 是 恒 等 函 数 。 


下 面 我 们 将 使 用 #1ang plai 语言 ， 原 因 有 两 个 。 首 先 ， 这 更 好 地 模拟 了 动态 类 型 语言 编 
程 。 其 次 ， 为 了 简单 起 见 ， 我 们 会 将 类 型 声明 写成 加 约 ， add 


由 类 型 检查 器 处 理 ， 而 我 们 无 法 看 到 os 。 从 效果 来 看 ， 司 ? 类 型 检查 器 会 更 容 
易 。 然 而 ， 即 使 在 静态 类 型 的 世界 里 ， 贺 约 也 是 非常 有 意义 的 ， Eh 人们 增强 了 程序 员 


可 以 表达 的 不 变量 。 


这 些 可 以 编码 成 如 下 的 函数 : 


(define (make-contract pred?) 
(lambda (val) 
(if (pred? val) val (blame "violation")))) 


(define (blame s) (error 'contract "~a" s)) 


净 约 的 例子 


(define non-neg?-contract 
(make-contract 
(lambda (n) (and (number? n) 


(>= n 0))))) 


(在 静态 类 型 语言 中 ， 检 查 number? 当然 是 不 必要 的 ， 因 为 它 可 以 由 使 用 加 约 的 函数 的 类 型 
编码 并 静态 检查 ! ) 假设 我 们 计算 平方 根 时 要 确保 不 会 得 到 虚数 ; 可 以 这 人 么 写 


(define (real-sqrt-1 x) 
(sqrt (non-neg?-contract x))) 


在 很 多 语言 中 ， 断 言 是 写作 语句 而 不 是 表达 式 ， 所 以 另 一 种 编写 方式 是 : 


(define (real-sqrt-2 x) 
(begin 
(non-neg?-contract x) 
(sqrt x))) 


(在 某 些 情况 下 ， 这 种 形式 更 清晰 ， 因 为 它 在 函数 的 开始 部 分 清晰 地 声明 了 参数 的 期 望 值 。 
它 还 确保 参数 只 被 检查 一 次 。 实 际 上 ， 在 某 些 语言 中 ， 契 约 可 以 写 入 函数 头 部 中 ， 从 而 改善 
函数 界面 中 能 给 出 的 信息 。) 现在 ， 如 果 将 real-sqrt-1 或 real-sqrt-2 应 用 于 4 ， 则 它们 
产生 2 ， 但 如 果 应 用 于 -1 ， 则 会 引发 违反 契 约 的 错误 。 


16.2 标签 、 类 型 和 对 值 的 观察 


到 这 里 我 们 已 经 重 现 了 大 多 数 语言 中 断言 系统 的 本 质 。 还 有 什么 要 讨论 的 ? 我 们 假设 手 上 的 
语言 不 是 静态 类 型 的 。 那 么 我 们 想 要 编写 的 断言 至 少 要 能 重 现 传 统 的 类 型 不 变量 ， 如 果 不 是 
更 多 的 话 。 前 述 的 make-contract 可 以 覆盖 所 有 标准 类 型 的 属性 ， 比 如 检查 数 、 字符 串 等 等 
假设 语言 提供 了 合适 的 谓词 ， 或 者 可 以 从 已 有 的 谓词 中 构造 出 来 。 是 这 样 吗 ? 


回想 一 下 ， 即 使 我 们 最 简单 的 类 型 语言 也 不 仅仅 是 类 似 数 的 基本 类 型 ， 还 包含 构造 类 型 。 尽 
管 其 中 的 一 些 ， 如 链表 和 和 向量， 似乎 并 不 是 很 难 ， 但 一 旦 涉及 赋值 、 性 能 和 责备 (这 一 点 将 
在 后 面 讨 论 ) 挑战 就 来 了 。 然 而 ， 函 数 就 很 难处 理 了 。 


作为 示例 ， 我 们 来 看 这 个 函数 : 


(define d/dx 
(lambda (f) 
(lambda (x) 
(/ (- (f (+ x 0.001)) 
(f x)) 
0.001)))) 


((number -> number) -> (number -> number)) 


( 它 读 入 一 个 函数 ， 并 生成 由 其 派生 的 另 一 个 函数 。) 假设 我 们 想 用 回 约 来 处 理 这 种 情况 。 


根本 的 问题 是 ， 在 大 多 数 语言 中 ， 我 们 无 法 直接 将 其 表示 为 谓词 。 大 多 数 语言 的 运行 时 系统 
关于 值 的 类 型 存储 了 非常 有 限 的 信息 -对 于 迄今 为 止 我 们 所 看 到 的 美 型 ， 这 些 有 限 的 信息 
可 以 用 不 同 的 名 称 来 描述 ; 传统 上 它们 被 称 为 标签 (tag) 。【 注 释 】 有 些 情况 下 ， 标 签 与 我 
们 认为 的 类 型 相符 : 例如 ， 数 会 带 上 标签 ， 将 其 标识 为 数 (甚至 可 能 是 某 种 特定 类 型 的 

数 ) 、 字 符 囊 带 的 标签 将 其 标识 为 字符 串 ， 等 等 。 因 此 ， 我 们 可 以 基于 这 些 标签 的 值 来 编写 
谓词 。 





已 经 有 一 些 工作 试图 保存 丰富 的 类 型 信息 ， 从 源 程 序 到 较 低 的 抽象 层次 、 一 直到 汇编 语 
言 ， 但 这 些 都 是 研究 工作 。 


当 我 们 处 理 结构 化 值 时 ， 情 况 就 复杂 了 。 向 量 将 会 带 有 标签 声明 它 是 向 量 ， 但 不 会 指明 它 的 
元 素 是 什么 类 型 的 值 〈 而 且 它们 甚至 可 能 都 不 是 同一 类 型 ) ; 不 过 ， 程 序 通常 也 可 以 获得 向 
量 的 大 小 ， 从 而 遍历 向 量 来 收集 此 信息 。 (然而 ， 关 于 结构 化 值 后 面 有 更 多 讨论 。) 


思考 是 


编写 契约 ， 检 查 只 包含 偶数 的 链表 。 


(define list-of-even?-contract 
(make-contract 
(lambda (1) 
(and (list? 1) (andmap number? 1) (andmap even? 1))))) 


(同样 ， 请 注意 ， 如 果 我 们 静态 地 知道 这 是 数 的 链表 ， 则 无 需 问 前 两 个 问题 。) 类 似 地 ， 对 
象 可 能 只 是 将 自己 标识 为 对 象 ， 而 不 提供 其 他 信息 。 但 是 ， 在 允许 对 对 象 结构 进行 反射 
(reflection) 的 语言 中 ， 净 约 仍 可 以 收集 它 所 需 的 信息 。 


然而 ， 在 任何 语言 中 ， 当 遇 到 函数 时 就 出 问题 了 。 我 们 一 般 将 函数 的 类 型 理解 为 包含 其 输入 
和 输出 的 类 型 ， 但 是 对 运行 时 系统 ， 函 数 只 是 带 有 函数 标签 的 不 透明 对 象 ， 可 能 还 有 一 些 非 
常 有 限 的 元 数据 〈 如 函数 的 参数 数量 ) 。 运 行 时 系统 甚至 难以 分 辩 函 数 是 否 读 入 和 生成 函数 
一 一 而 非 其 他 类 型 的 值 一 一 更 不 用 说 它 是 否 读 入 并 生成 (number -> number) 类 型 的 函数 。 


这 个 问题 很 好 地 体现 在 JavaScript 的 (错误 命名 的 ) typeof 运算 符 中 。 传 给 其 数 或 字符 串 等 
基本 类 型 的 值 ， typeof 会 返回 其 名 字 所 示 的 字符 串 (例如 "number"” ) 。 对 于 对 象 ， 它 返 
回 "object" 。 最 要 命 的 是 ， 对 于 函数 它 返 回 "function" ， 没 有 额外 的 信息 。 


出 于 这 个 原因 ， typeof 对 这 个 操作 符 来 说 可 能 是 个 糟糕 的 名 字 。 它 应 该 被 称 为 tagof ， 
为 未 来 的 JavaScript 静 态 类 型 系统 提供 了 申 正 的 typeof 留 出 空间 。 
总 而 言 之 ， 这 意味 着 当 遇 到 函数 时 ， 函 数 契 约 只 能 检查 它 是 否 的 确 是 函数 〈 如 果 不 是 ， 那 显 
然 是 错误 的 ) 。 它 无 法 检查 有 关 该 函数 的 定义 域 和 值 域 【 讨 论 : 翻译 成 输入 输出 (后 同 ) 会 不 会 
更 合适 ? 】 的 任何 信息 。 我 们 要 放 育 吗 ? 


16.3 高 阶 问 约 


为 了 确定 要 做 什么 ， 我 们 先 回 忆 一 下 契约 最 初 提 供 了 什么 保证 。 在 前 述 的 real-sqrt-1 中 ， 我 
们 要 求 参 数 是 非 负 的 。 然 而 ， 只 有 在 实际 使 用 real-sqrt-1 的 情况 下 才 会 进行 检查 ， 并 且 仅 检 
查实 际 传 入 的 值 。 例 如 ， 如 果 程 序 包含 片段 


(lambda () (real-sqrt-1 -1)) 


但 该 thunk 一 直 没 被 调用 ， 那 么 程序 员 永 远 不 会 看 到 这 里 的 契约 可 反 。 事 实 上 ， 可 能 在 程序 的 
这 次 运行 中 没有 调用 此 thunk， 但 在 后 一 次 运行 中 调用 到 了 ; 因此 ， 该 程序 包含 一 个 潜在 的 总 
约 错误 。 出 于 此 原因 ， 通 常 最 好 用 静态 类 型 来 表示 不 变量 ; 但 在 使 用 契约 时 ， 我 们 明白 ， 仅 
当 程 序 执 行 到 相关 位 置 时 ， 我 们 才 会 收 到 错误 通知 。 


这 是 有 用 的 见解 ， 因 为 它 为 我 们 的 函数 问题 提供 了 解决 方案 。 对 于 指明 的 函数 值 ， 我 们 立即 
检查 它 趴 的 是 函数 。 但 是 ， 我 们 不 会 忽略 定义 域 和 值 域 的 契约 ， 而 是 延迟 进行 。 我 们 在 函数 
(每 次 ) 实际 作用 于 茶 个 值 时 检查 定义 域 契 约 ， 并 在 函数 实际 返回 值 时 检查 值 域 契 约 。 


make-contract 不 是 一 种 模式 。 因 此 ， 我 们 给 make-contract 起 个 更 具 描 述 性 的 名 
: 它 检查 即时 的 (immediate) 问 约 ( 即 当 前 可 以 完整 检查 的 契约 ) 。 


在 Racket 契 约 系统 中 ， 即 时 四 约 被 称 为 扁平 的 (flat) 。 这 个 术语 有 点 误导 ， 因 为 它们 也 
可 以 保护 数据 结构 。 


(define (immediate pred?) 
(lambda (val) 
(if (pred? val) val (blame val)))) 


相 比 之 下 ， 函 数 契 约 读 入 两 个 契约 作为 参数 一 分 别 表示 对 定义 域 和 值 域 的 检查 
谓词 。 这 个 谓词 作用 于 需要 满足 契约 的 值 。 首 先 ， 它 会 检查 给 定 的 值 实际 上 是 函数 : 这 部 分 

仍然 是 即时 的 。 然 后 ， 我 们 创建 一 个 代理 (surrogate) 函数 ， 由 它 来 应 用 "剩余 的 "契约 一 检 
查 定义 域 和 值 坟 
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二 六 


创建 代理 这 一 行为 背离 了 传统 的 断言 机 制 ， 也 就 是 只 是 简单 地 检查 值 、 保 持 值 的 独立 。 相 
反 ， 对 于 函数 ， 如 果 想 要 检查 契约 ， 我 们 必须 使 用 新 创建 的 代理 。 因 此 ， 一 般 来 说 我 们 需要 
创建 封装 函数 ， 它 会 读 入 契约 和 值 ， 并 创建 该 值 的 保护 版 本 : 


(define (guard ctc val) (ctc val)) 


人 |] 子 ， 假 设 我 们 要 用 数 契 约 包 装 addl 函数 (通过 稍 后 定义 的 function ， 叫 
数 契 约 的 构造 函数 ) 


(define al (guard (function (immediate number?) 
(immediate number? ) ) 
add1) ) 


我 们 希望 al 本 质 上 绑 定 到 以 下 代码 : 


(define al 
(lambda (x) 
(num?-con (add1 (num?-con x))))) 


其 中 (lambda (x) ...) 是 代理 ; 
违规 的 情况 下 ， 女 约 的 行为 就 是 
相同 。 


它 会 add1 的 调用 之 处 前 后 调用 数值 契约 。 回 忆 一 下 ， 在 没有 
臣 等 函数 ， 所 以 这 个 程序 在 不 违规 的 情况 下 行为 于 add1 完全 


为 了 达到 此 目的 ， 我 们 使 用 下 面 的 function 定义 。【 注 释 】 请 记 住 ， 我 们 还 必须 确保 给 定 的 
值 卜 的 是 函数 (这 里 的 addil 的 确 是 ， 这 一 点 可 以 立即 检查 ， 这 也 是 为 什么 在 我 们 将 代理 绑 定 
到 a1 时 此 项 检查 已 经 消失 的 原因 ) 


(define (function dom rng) 
(lambda (val) 
(if (procedure? val) 
(lambda (x) (rng (val (dom x)))) 
(blame val)))) 


简单 起 见 ， 我 们 这 里 假设 单 参数 函数 ， 不 过 扩展 到 多 参数 的 情况 很 简单 。 事 实 上 ， 更 复 
杂 的 契约 甚至 可 以 检查 参数 之 间 的 关系 。 


要 理解 这 是 如 何 工 作 的 ， 我 们 来 替换 参数 。 为 了 保持 代码 可 读 性 ， 我 们 先 构 造 number? 契约 
检查 器 ， 并 将 其 命名 


(define num?-con (immediate number?)) 
= (define num?-con 
(lambda (val) 
(if (number? val) val (blame val)))) 


回 到 ad 的 定义 。 我 们 先 调用 guard 


(define al 
((function num?-con num?-con) 
add1)) 


接 下 来 调用 函数 契约 的 构造 函数 : 


(define al 
((lambda (val) 
(if (procedure? val) 
(lambda (x) (num?-con (val (num?-con x)))) 
(blame val))) 
add1)) 


调用 左 括 号 - 左 括号 -lambda 得 : 


(define al 
(if (procedure? add1) 
(lambda (x) (num?-con (add1 (num?-con x)))) 
(blame add1))) 


请 注意 ， 这 一 步 会 检查 被 保护 的 值 的 确 是 函数 。 因 此 我 们 得 到 


(define al 
(lambda (x) 
(num?-con (add1 (num?-con x))))) 


这 正 是 我 们 想 要 获得 的 代理 ， 对 于 不 违规 的 调用 ， 其 行为 就 是 addl 。 
思考 


有 多 少 种 方式 可 以 违背 上 述 的 add1 贺 约 ? 


pl 


、 


三 种 方式 ， 分 别 对 应 于 三 个 问 约 构造 函数 : 


1. 被 封装 的 值 可 能 不 是 函数 ; 
2. 被 封装 的 是 函数 ， 它 可 能 被 作用 于 不 为 数 的 值 ; 或 者 
3. 被 封装 的 是 函数 ， 输 入 也 是 数 ， 但 其 返回 值 不 是 数 类 型 。 


人 种 违规 行为 ， 并 观察 契约 系统 的 行为 。 你 能 改进 错误 信息 以 更 好 地 区 
加 9 


同样 的 封装 技术 也 适用 于 dydx 


(define d/dx 
(guard (function (function (immediate number?) (immediate number?)) 
(function (immediate number?) (immediate number?))) 
(lambda (f) 
(lambda (x) 
(/ (- (f (+ x 0.001)) 
(f x)) 
0.001))))) 


练习 


违反 此 契约 的 方式 有 七 种 ， 分 别 对 应 于 七 个 契约 构造 函数 。 根 据 需 要 ， 传 入 (错误 的 ) 
参数 或 修改 代码 ， 以 违反 它们 中 的 每 一 个 。 是 否 可 以 改进 错误 报告 ， 以 正确 识别 每 种 
规 行为 ? 


违 


六 数 的 问 约 推 迟 了 两 处 即时 贺 约 的 检查 ， 而 不 是 一 处 。 这 符合 我 们 的 期 望 ， 
能 报告 实际 值 的 问题 ， SR a ne 


但 是 ， 这 确实 意味 着 "违规 "这 个 概念 很 微妙 : 传递 给 d/dx 的 函数 值 可 能 的 确 违 反 了 加 约 ， 但 
这 类 违规 只 有 在 传递 或 返回 数值 之 后 才 会 被 观察 到 。 


16.4 便捷 语法 


之 前 我 们 看 到 了 两 种 扁平 契约 的 使 用 风格 ， 分 别 由 real-sqrt-1 和 real-sqrt-2 体现 。 这 两 种 
ee 吕 用 于 高 阶 值 〈 函 数 ) ， 因 为 被 封装 
。 《当然 ， 传 统 的 断言 系统 只 处 理 扁 平 契 约 ， 所 以 它们 忽略 了 这 个 细微 的 差 

。) 前 者 将 值 的 使 用 放 与 契约 之 中 ， 理 论 上 这 可 行 ， 但 有 三 个 缺点 : 


1. 开发 人 员 可 能 会 忘记 封装 某 些 使 用 。 
2， 加 约 在 每 次 使 用 中 都 会 被 检查 一 次 ， 在 多 次 使 用 时 这 是 浪费 。 
3， 程序 混合 了 贺 约 检查 和 其 功能 行为 ， 降 低 了 可 读 性 。 


幸运 的 是 ， 一 般 情况 下 ， 明 智 地 使 用 语法 糖 就 可 以 解决 此 问题 。 例 如 ， 假 设 我 们 要 将 契约 附 
加 到 函数 的 参数 上 ， 那 么 开发 人 员 可 以 这 么 编写 : 


(define/contract (real-sqrt (x :: (immediate positive?) )) 
(sqrt x)) 


意图 是 用 positive? 来 保护 x ， 但 只 在 函数 调用 时 只 执行 一 次 检查 。 这 应 该 转化 为 : 


(define (real-sqrt new-x) 
(let ([x (guard (immediate positive?) new-x)]) 
(sqrt x))) 


也 就 是 说 ， 宏 为 每 个 标识 符 生成 新 名 称 ， 然 后 将 用 户 给 出 的 名 称 关联 到 新 名 称 的 封装 版 本 。 
这 个 宏 的 实现 如 下 : 


(define-syntax (define/contract stx) 
(syntax-case stx (::) 
WE CH (dD) 
(with-syntax ([(new-id ...) (generate-temporaries #'(id ...))]) 
#'(define f 
(lambda (new-id ...) 
(let ([id (guard c new-id)] 


oa 
b))))])) 


有 了 这 些 (语法 上 的 ) 便利 ， 契 约 语言 的 设计 师 可 以 提高 契约 使 用 的 可 读 性 、 效 率 和 健壮 
性 。 


16.5 扩展 到 复 结构 


st 已 经 讨论 过 的 ， 将 契约 扩展 到 结构 化 数据 类 型 人 ee 

类 型 ) 似乎 很 容易 。 唯 一 需要 的 是 提供 适当 的 运行 时 观察 值 。 通 常事 情 就 是 这 样 ， 语 言 提 
种 精度 的 类 型 。 例 如 ， 正 如 我 们 之 前 讨论 过 的 ， 支 持 数据 类 型 ， 不 需要 类 型 谓词 ， 
但 仍然 会 提供 谓词 来 区 分 变 体 ; 这 种 情况 下 ， 类 型 级 别 的 “契约 "检查 最 好 (也 许 必 须 ) 留 给 静 
态 类 型 系统 ， 而 由 契约 来 断言 更 精确 的 结构 特性 。 


但 是 ， 这 种 策略 可 能 会 遇 到 严重 的 性 能 问题 。 例 如 ， 假 设 我 们 编写 了 平衡 二 又 搜索 树 ， 能 以 
对 数 渐 近 时 间 ( 相 比 树 的 大 小 ) 实现 插入 和 查找 。 接 下 来 我 们 将 树 封装 在 合适 的 契约 中 。 遗 
憾 的 是 ， 仅 检查 契约 就 会 访问 整个 树 ， 从 而 用 去 线性 时 间 ! 因此 ， 理 想 情 况 下 更 好 的 策略 
是 ， 构 建树 的 时 候 就 (以 增 量 方式 ) 完成 契约 检查 ， 查 找 时 则 不 需要 再 次 检查 。 


更 糟 的 是 ， 平 衡 和 搜索 树 顺序 都 是 递归 属性 。 因 此 原则 上 ， 它 们 附加 于 每 个 子 树 上 ， 所 以 每 
次 递归 调用 都 需要 作用 。 在 插入 过 程 中 ， 由 于 插入 是 递归 的 ， 将 在 每 个 访问 的 子 树 上 检查 净 
约 。 在 大 小 为 $$t$$ 的 树 中 ， 回 约 谓词 应 用 于 $$\frac{t}{2}$$ 元 素 的 子 树 ， 然 后 应 用 于 
$$\frac{t}{4}$$ 元 素 的 子 子 树 ， 依 此 类 推 ， 在 最 坏 情况 下 ， 会 访问 总 数 为 $$\frac{t}{2}+\fractt} 
{4}+...+\frac{t}{ 耻 $$ 的 元 素 一 一 使 我 们 预期 的 对 数 时 间 插 入 过 程 花费 线性 时 间 。 


对 这 两 个 例子 ， 许 多 情况 下 都 可 以 采用 措施 缓解 。 每 个 值 都 需要 与 它 已 经 通过 的 一 组 契约 相 
关联 (或 内 部 存储 ， 或 存储 于 散 列 表 中 ) 。 然 后 ， 当 需要 调用 契约 时 ， 首 先 检 查 它 是 否 已 被 
检查 过 ， 如 果 有 ， 则 不 再 检查 。 这 实质 上 是 将 契约 检查 记忆 化 (memoization ) ， 从 而 减少 检 
查 的 算法 复杂 性 。 当 然 ， 对 记忆 化 而 言 ， 最 好 值 是 不 可 变 的 。 如 果 这 些 值 可 能 发 生变 化 ， 并 
且 站 约 执行 任意 计算 ， 那 么 此 优化 可 能 无 法 做 到 可 靠 。 


检查 数据 结构 还 有 一 个 微妙 的 问题 。 作 为 例子 ， 考 虑 我 们 之 前 编写 的 检查 数 链 表 中 所 有 值 均 
是 偶数 的 契约 。 假 设 我 们 已 经 用 净 约 封装 了 链表 ， 但 只 对 链表 的 第 一 个 元 素 感 兴趣 。 当 然 ， 
我 们 检查 了 列表 中 的 所 有 值 ， 这 可 能 需要 很 长 时 间 。 但 更 重要 的 是 ， 用 户 可 能 会 争辩 说 ， 报 
告 链表 第 二 个 元 素 违规 的 行为 本 身 违反 了 我 们 对 契约 检查 的 期 望 ， 因 为 我 们 并 未 实际 使 用 该 
元 素 。 


这 意味 着 推迟 检查 某 些 值 ， 即 使 它们 可 以 即时 被 检查 。 例 如 ， 可 以 将 整个 链表 转换 为 包含 延 
时 检查 的 封装 值 ， 每 个 值 仅 在 访问 时 被 检查 。 这 种 策略 可 能 很 有 吸引 力 ， 但 将 其 编码 并 不 简 
单 ， 尤 其 当 存 在 别名 的 情况 下 会 遇 到 问题 : 如 果 两 个 不 同 的 标识 符 引 用 同一 链表 ， 一 个 有 回 
约 保护 而 另 一 个 没有 ， 我 们 必须 确保 它们 都 按 预 期 运行 (这 通常 意味 着 我 们 不 能 在 链表 中 存 
储 任何 可 变 状态 ) 。 


16.6 契约 和 观察 


契约 实现 还 有 一 个 奇怪 的 普遍 问题 ， 而 复杂 数据 加 剧 了 这 个 问题 。 之 前 ， 我 们 抱怨 说 检查 函 
数 的 净 约 很 难 ， 因 为 我 们 没有 足够 的 能 力 去 观察 : 我 们 可 以 检查 的 只 是 值 是 否 是 函数 。 在 丨 
实 的 语言 中 ， 数 据 结构 的 问题 其 实 是 相反 的 : 我 们 有 太 多 的 观察 能 力 。 例 如 ， 如 果 我 们 实施 
延迟 检查 链表 的 策略 ， 则 很 可 能 需要 使 用 某 个 结构 体 来 保存 实际 列表 ， 并 修 

改 first 和 rest ， 以 此 《检查 韶 约 后 ) 获取 结构 体 中 的 值 。 但 是 ， 像 list? 这 样 的 函数 现 
在 可 能 返回 false 而 不 是 true ， 因 为 结构 体 不 是 链表 ; 因此 ， list? 需要 绑 定 到 新 函数 

上 ， 遇 到 这 些 特殊 的 表示 链表 的 延迟 契约 结构 体 也 返回 true 。 但 契约 系统 作者 还 需要 记得 解 
决 cons? 、 pair? ， 天 知道 还 有 多 少 其 他 函数 都 可 以 进行 观察 。 


一 般 来 说 ， 有 一 个 观察 基本 上 不 可 能 “修复 ”: eq? 。 通 常情 况 下 ， 每 个 值 eq? 它 自己 ， 即 使 
函数 也 是 如 此 。 然 而 ， 函 数 封装 以 后 就 是 新 的 函数 了 ， 不 但 不 eq? 自己 ， 也 不 应 该 ， 因 为 其 
行为 趴 的 不 同 了 (尽管 只 是 在 违反 回 约 的 情况 下 ， 并 且 只 在 提供 了 输入 值 以 观察 违规 行为 
后 ) 。 然 而 ， 这 意味 着 程序 无 法 上 暗中 保护 自己 ， 因 为 守护 行为 可 以 被 观察 到 。 因 此 ， 和 恶意 模 
块 有 时 可 以 检测 它 收 到 的 是 否 是 受 保护 的 值 ， 如果 是 就 正常 运行 ， 否 则 就 不 ! 


16.7 问 约 和 赋值 


我 们 无 疑 应 该 关注 回 约 与 赋值 之 间 的 相互 作用 ， 当 回 约 推 迟 一 一 固有 延 时 或 者 以 延 时 方式 实 
现时 更 是 如 此 。 有 两 件 事 值得 关注 。 一 是 将 问 约 值 存 储 在 可 变 状态 中 ; 二 是 为 可 变 状态 
编写 的 问 约 。 





当 我 们 存储 回 约 值 时 ， 封 装 策 略 确 保 回 约 检 查 正常 进行 。 在 每 个 步骤 ， 加 约 都 会 尽 可 能 多 地 
检查 现 有 的 值 ， 并 创建 其 余 检 查 的 封装 值 。 因 此 ， 即 使 这 个 封装 值 被 存储 在 可 变 状 态 并 在 稍 
后 检索 以 供 使 用 ， 它 仍然 包含 这 些 检查 ， 并 且 当 值 最 终 被 使 用 时 它们 将 被 执行 。 


另 一 个 问题 是 编写 可 变数 据 的 契约 ， 如 box 和 向 量 。 在 这 种 情况 下 ， 我 们 可 能 必须 为 包含 契约 
的 整个 数据 类 型 创建 封装 。 然 后 ， 当 数据 类 型 中 的 值 被 替换 为 新 值 时 ， 执 行 更 新 的 操作 〈 俱 
如 set-box! ) 需要 从 封装 中 检索 契约 2 将 其 应 用 于 新 值 并 存储 新 封装 的 值 。 因 此 ， 这 需要 修 
改 数据 结构 赋值 操作 符 的 行为 ， 使 其 对 回 约 值 敏 感 。 然 而 ， 赋 值 不 会 改变 违规 行为 的 发 生 

点 : 即时 问 约 即时 发 生 ， 延 时 回 约 遇 到 (非法) 输入 值 时 发 生 。 


16.8 契约 的 组 合 


我 们 已 经 讨论 过 所 有 基本 数据 类 型 的 组 合 ， 本 节 很 自然 要 契约 的 组 合 。 正 如 之 前 讨论 的 联合 
和 交叉 类 型 一 样 ， 我 们 应 该 考虑 契 约 的 联合 和 交叉 (分别 是 "或 "与 “和 ”) ; 还 应 当 考 虑 取 反 。 
然而 ， 契 约 只 是 表面 上 类 似 于 类 型 ， 所 以 我 们 必须 根据 契约 来 考虑 这 些 问 题 ， 而 不 是 试图 将 
我 们 从 类 型 学 到 的 意义 映射 到 契约 领域 。 





上 用 or 组 合 而 交叉 契约 通过 合 取 组 合 。 我 们 依次 调用 谓词 ， 进 行 短路 求 值 译注， 参见 
后 文 ) ， 最 后 产生 错误 或 返回 契约 的 值 。 交 叉 契 约 通过 合 取 ( and ) 组 合 。 而 取 反 回 约 就 是 
直接 调用 原始 的 契约 ， 但 对 谓词 取 非 《通过 not ) 。 





直接 的 例子 总 是 简单 的 。 联 合 契 约 通过 析 取 组 合 一 事实 上 ， 因 为 是 谓词 ， 其 结果 可 以 字面 
ww 


在 延迟 、 高 阶 的 情况 下 ， 回 约 组 合 要 困难 得 多 。 例 如 ， 考 虑 从 数 到 数 的 函数 回 约 的 取 反 。 对 
它 取 反 到 底 是 什么 意思 ? 是 否 表 示 该 函数 不 应 接受 数 了 或 者 如 果 接 受 了 数 ， 它 不 应 该 返回 
数 ? 或 两 者 都 要 ? 特别 是 ， 我 们 如 何 执行 这 样 的 契约 ? 例如 ， 如 何 检查 茶 个 函数 不 接受 数 
一 一 是 否 期 望 在 给 予 数 时 会 产生 错误 ? 但 请 考虑 用 这 样 的 契约 封装 的 恒 等 函 数 ; 因为 当 给 予 
数 (或 者 其 他 任何 值 ) 时 ， 它 显然 不 会 出 错 ， 这 是 否 意味 着 应 该 等 到 它 产生 值 ， 如 果 它 确实 
产生 了 数 ， 那 么 拒绝 它 ? 但 最 糟糕 的 是 ， 请 注意 ， 这 意味 着 我 们 将 在 未 定义 的 定义 域 中 运行 
函数 : 显然 这 会 破坏 程序 中 的 不 变量 、 污 染 堆栈 、 或 使 程序 崩溃 。 


交叉 契约 要 求 值 通过 所 有 子 契 约 。 这 意味 着 高 阶 值 需要 重新 封装 ， 检 查 所 有 定义 域 子 契 约 以 
及 所 有 值 域 子 契约 。 只 要 一 个 子 契 约 没 有 满足 ， 整 个 交叉 (契约 ) 都 会 失败 。 


联合 契约 更 加 微妙 ， 因 为 任何 一 个 子 契 约 失败 都 不 直接 导致 拒绝 。 相 反 ， 它 只 是 意味 着 这 个 
子 契 约 不 再 能 候选 代表 契 约 所 封装 的 值 ; 其 他 子 契 约 仍 然 可 以 候选 代表 之 ， 只 有 当 没 有 任何 
子 契 约 候选 时 才 拒 绝 值 。 这 意味 着 联合 契约 的 实现 必须 在 内 存 中 记录 哪些 子 契 约 通过 或 失败 
一 一 而 这 里 内 存 就 意味 着 需要 修改 记录 。【 注 释 】 由 于 每 条 子 包 回 约 失败 时 ， 它 将 被 从 候选 
名 单 删除 ， 而 剩 下 的 会 继续 执行 。 当 没有 候选 子 契 约 时 ， 系 统 必 须 报 告 违 规 行为 。 错 误 报 告 
最 好 要 提供 导致 每 个 子 契 约 失败 的 实际 值 (请 记 住 ， 这 些 值 可 能 衣 套 在 多 层 函 数 中 ) 。 


在 类 似 Racket 的 多 线程 语言 中 ， 还 需要 加 锁 以 避免 竞争 条 件 。 


Racket 所 实现 的 契约 构造 器 和 组 合 器 对 可 接受 的 子 契 约 形式 提出 了 限制 。 这 使 得 实现 既 有 效 
率 又 能 提供 有 用 的 错误 消息 。 此 外 ， 上 面 讨论 的 极端 情况 很 少 在 实践 中 出 现 一 当然 现在 如 
果 需 要 你 知道 如 何 实现 它们 。 


16.9 责备 


本 节 回 过 头 讨论 报告 契约 违反 的 问题 。 这 指 的 不 是 打印 什么 字符 事 ， 而 是 更 重要 的 问题 ， 报 
告 什么 。 我 们 将 看 到 ， 此 问题 实际 上 是 语义 上 的 考虑 。 


为 了 说 明 这 个 问题 ， 回 想 一 下 上 面 d/dx 的 定义 ， 假 设 我 们 在 没有 任何 净 约 检 查 的 情况 下 运 
行 。 先 假设 我 们 将 这 个 函数 应 用 于 完全 不 合适 的 string-append ( 它 既 不 读 入 也 不 产生 数 ) 。 
这 么 做 只 会 产生 一 个 值 : 


> (define d/dx-sa (d/dx string-append ) ) 


(请 注意 有 即使 有 契约 检查 ， 这 也 会 通过 ， 因 为 函数 契约 的 即时 部 分 认可 string-append 是 函 
数 。) 接 下 来 假设 我 们 将 d/dx-sa 应 用 于 一 个 数 ， 这 应 是 正常 行为 : 


> (d/dx-sa 10) 

string-append: contract violation 
expected: string? 
given: 10.001 


请 注意 ， 错 误 报 告 位 于 d/dx 函数 体 的 内 部 。 一 方面 ， 这 完全 是 合理 的 : 这 

是 string-append 不 正确 调用 发 生 的 地 方 。 另 一 方面 ， 错 误 并 非 来 自 d/dx ， 而 来 自 来 自 提 
供 string-append 、 并 声称 它 是 合法 的 数 到 数 的 函数 的 代码 。 但 问题 是 ， 做 这 件 事 的 代码 早已 
逃 之 天 天 ; 它 已 经 不 在 堆栈 中 ， 因 此 也 不 在 传统 错误 报告 机 制 的 范围 内 。 





这 个 问题 不 是 d/dx 所 特有 的 ; 事实 上 ， 大 型 系统 中 它 很 常见 。 这 是 因为 系统 尤其 是 图 

形 、 网 络 和 其 他 外 部 接口 的 系统 中 大 量 使 用 回调 (callback) : 因为 对 某 个 实体 感 兴趣 而 
被 注册 的 函数 〈 或 方法 ) ， 要 发 某 种 状态 或 值 的 信号 时 被 调用 。 (在 这 里 ，d/dx 等 价 于 图 形 
层 ， 而 string-append 等 价 于 传 给 它 (并 由 它 存 储 ) 的 回调 。 ) 最 终 ， 系统 层 会 调用 回调 。 如 





果 这 会 导致 错误 ， 那 既 不 是 系统 层 的 错误 ， 它 收 到 的 回调 声明 的 回 约 是 正确 的 ， 也 不 是 回调 
本身 的 错误 ， 它 应 该 有 合理 的 用 途 ， 只 是 被 错误 地 提供 给 函数 。 相 反 ， 错 误 来 源 于 引入 这 两 
者 的 实体 。 然 而 ， 此 时 调用 栈 只 包含 回调 (位 于 栈 顶 ) 和 系统 (位 于 其 下 ) 一 一 唯一 有 错 的 
一 方 不 在 了 。 这 种 类 型 的 错误 因此 非常 难 调试 。 


解决 办 法 是 扩展 契 约 系统 ， 纳 入 责备 〈blame) 【 初 译注 : 责任 ? 】 的 概念 。 想 法 是 ， 有 效 地 
记录 何方 导致 一 对 组 件 汇合 在 一 起 ， 以 便 如 果 它 们 之 间 发 生 回 约 违规 ， 我 们 可 以 将 失败 归 因 
于 这 一 方 。 请 注意 ， 这 只 是 在 函数 的 情况 下 有 意义 ， 但 为 了 一 致 性 ， 我 们 以 自然 的 方式 将 责 
备 扩展 到 即时 契约 。 


对 于 有 函数 ， 请 注意 有 两 种 可 能 的 失败 点 : 要 么 它 被 给 
它 生成 了 错误 的 值 (后 验 条 件 ) 。 区 分 这 两 种 情况 很 
责备 环境 一 一 特别 是 实际 参数 的 表达 式 一 一 而 在 后 
应 该 责备 该 函数 本 身 。〈 对 即时 值 的 自然 延伸 ， 我 们 
验 条 件 ”) 。 


子 了 是 错误 的 值 ( 先 验 条 件 ) ， 要 么 是 
重要 ， 因 为 在 前 一 种 情况 下 ， 我 们 应 该 
一 种 情况 下 (假设 参数 已 经 通过 ) ， 我 们 
只 能 责备 值 本 身 不 满足 契约 ， 也 就 是 “后 





对 于 回 约 ， 我 们 引入 术语 正 (positive) 和 负 (negative) 位 置 。 对 于 一 阶 函 数 ， 负 位 置 是 先 
验 条 件 ， 正 位 置 是 后 验 条 件 。 这 么 看 这 似乎 是 不 必要 的 额外 术语 。 但 我 们 很 快 就 会 看 到 ， 这 
两 个 术语 具有 更 一 般 的 含义 。 


现在 将 情况 推广 到 契约 a 。 之 前 ， 即 时 回 约 读 入 一 个 谓词 ， 而 郊 数 问 约 读 入 定义 域 和 值 


域 的 契约 。 这 点 保持 不 变 。 不 过 它们 返回 的 将 是 函数 ， 此 函数 有 两 个 参数 : 正 负 位 置 的 标 
签 。 (这 个 标签 A 类 型 : 抽象 语法 节点 、 缓 冲 区 偏 移 量 、 或 其 他 描述 
符 。 简 单 起 见 ， 我 们 使 用 字符 串 。) 这 样 ， 函 数 契 约 将 闭 包 于 程序 位 置 标签 ， 以 便 将 来 责备 


非法 函数 的 提供 方 。 


现在 由 guard 函数 负责 传 入 契约 调用 位 置 的 标签 : 


(define (guard ctc val pos neg) ((ctc pos neg) val) ) 


(define (blame S) (error 'contract s)) 


假设 我 们 像 以 前 一 样 ， 保 护 addl 的 使 用 。 正 负 位 置 用 什么 名 字 有 意义 呢 ? 正 位 置 是 后 验 条 
件 : 这 里 的 任何 失败 都 必须 责备 add1 的 函数 体 。 负 位 置 是 先 验 条 件 : 这 里 的 任何 失败 都 必须 
责备 add1 的 参数 。 因 此 : 


(define al (guard (function (immediate number?) 
(immediate number? ) ) 
add1 
"add1 body" ;add1 有 函数 体 
"add1 input")) ;add1 的 输入 


假设 传 给 guard 的 不 是 函数 ， 我 们 会 期 望 在 “后 验 条 件 " 位 置 出 现 错误 : 这 并 不 是 后 验 条 件 的 失 
败 ， 而 是 因为 ， 如 果 调 用 的 不 是 函数 ， 不 能 去 指责 参数 。 (当然 ， 这 表明 我 们 这 里 扩展 了 术 
语 “ 后 验 条 件 ”， 更 合理 地 应 该 使 用 术语 “ 正 〈 位 置 ) "”。) 因为 相信 add1 的 实现 只 会 返回 数 ， 
所 以 我 们 预计 它 不 可 能 让 后 置 条 件 失败 。 当 然 ， 我 们 期 望 像 (al "x") 这 样 的 表达 式 触 发 先 验 
条 件 错误 ， 可 以 在 "add1 input" 位 置 处 发 出 契约 错误 。 相 反 ， 如 果 我 们 保护 的 函数 违反 了 后 
验 条 件 ， 比 如 这 样 ， 


(define bad-ai (guard (function (immediate number?) 
(immediate number? ) ) 
number->string 
"bad-add1 body" 
"bad-add1 input")) 


我 们 希望 责备 被 归 答 于 "pad-add1 body" 。 


接 下 来 讨论 如 何 实 现 这 些 契 约 构造 函数 。 对 于 即时 净 约 ， 我 们 说 过 应 把 责备 归 答 于 正 位 置 : 


(define (immediate pred?) 
(lambda (pos neg) 
(lambda (val) 
(if (pred? val) val (blame pos))))) 


对 于 函数 ， 我 们 可 能 想 这 么 写 


(define (function dom rng ) 
(lambda (pos neg) 
(lambda (val) 
(if (procedure? val) 
(lambda (x) (dom (val (rng x)))) 
(blame pos))))) 


但 是 这 根本 不 能 运作 : 它 违反 了 回 约 所 预期 的 签名 。 这 是 因为 ， 现 在 所 有 回 约 都 期 望 输入 正 

负 位 置 的 标签 ， 也 就 是 dom 和 rng 不 能 像 上 面 那 样 使 用 。 ( 另 一 个 理由 ， 兄 数 体 中 用 到 

了 pos ， 但 完全 不 含 neg ， 尽 管 已 经 看 到 过 一 些 例子 ， 我 们 认为 责备 必须 归 和 耸 于 neg 所 绑 定 
的 位 置 。) 所 以 很 明显 ， 我 们 要 以 某 种 方式 使 用 pos 和 neg 实例 化 的 值 域 和 定义 域 契约 ， 以 
便 它 们 “知道 ?和 " 记 住 " 可 能 调用 非法 函数 的 地 方 。 


最 显然 的 做 法 是 用 相同 的 dom 和 rng 值 实例 化 这 些 契 约 构造 函数 : 


(define (function dom rng ) 
(lambda (pos neg) 
(let ([dom-c (dom pos neg)] 
[rng-c (rng pos neg)]) 

(lambda (val) 

(if (procedure? val) 

(lambda (x) (rng-c (val (dom-c x)))) 
(blame pos)))))) 


现在 所 有 签名 都 匹配 了 ， 契约 了 。 但 这 样 做 时 ， 返 回 不 太 对 劲 。 上 比如， 在 我 们 
最 简单 的 违反 回 约 的 例子 中 ， 返 回 是 


wy (al "< ) 
contract: add1 body 


呈 ?也许 我 们 应 该 展开 ad 的 代码 ， 来 看 看 发 生 了 什么 


(al WW ) 
(guard (function (immediate number?) 
(immediate number?)) 


add1 
"add1 body" 
"add1 input") 
= (((function (immediate number?) (immediate number?)) 
"add1 body" "add1 input") 
add1) 
(let ([dom-c ((immediate number?) "add1 body" "add1 input")] 
[rng-c ((immediate number?) "add1 body" "add1 input")]) 
(lambda (x) (rng-c (add1 (dom-c x))))) 
= (let ([dom-c (lambda (val) 
(if (number? val) val (blame "add1 body")))] 
[rng-c (lambda (val) 
(if (number? val) val (blame "add1 body")))]) 
(lambda (x) (rng-c (add1 (dom-c x))))) 


可 怜 的 addi : 它 都 没有 获得 机 会 ! 剩 下 的 唯一 责 签 是 "add1 body" ， 所 以 只 能 责备 它 
了 。 


等 下 会 讨论 此 问题 ， 先 来 观察 上 面 的 代码 ， 其 中 没有 任何 函数 净 约 的 踪迹 。 我 们 有 的 只 是 即 
时 契约 ， 当 实际 值 (如 果 ) 发 生 时 进行 责备 。 这 与 我 们 之 前 所 说 只 能 观察 到 即时 值 完 全 
致 。 当 然 ， 这 只 适用 于 一 阶 函 数 ; 当 遇 到 高 阶 函 数 时 ， 这 不 再 成 立 。 


错 在 哪里 ?请 注意 ， 在 addl 函数 体 中 只 有 绑 定 到 rng-c 的 契约 应 该 被 责备 。 相 反 ， add1 的 
输入 中 应 该 被 责备 的 是 绑 定 到 dom-c 的 契约 。 看 起 来 ， 在 函数 契约 的 定义 域 位 置 ， 正 负 标 签 


契约 保护 的 d/dx ， 我 们 会 发 现 情况 确实 如 此 。 关 键 的 见解 是 ， 当 调用 的 函数 作为 参数 
“外 部 ?成 为 "内 部 ”， 反 之 亦 然 。 也 就 是 说 ， d/dx 的 函数 体 一 -处 于 正 位 置 调用 了 被 
分 的 函数 ， 将 这 个 函数 的 函数 体 置 于 正 位 置 ， 并 将 调用 者 一 一 d/dx 的 函数 体 一 一 置 于 负 
。 因此， 在 回 约 的 定义 域 一 侧 ， 每 次 诅 套 函数 回 约 都 会 导致 正 负 位 置 交 换 。 





值 域 一 2 。 继续 考虑 d/dx 。 它 返回 的 函数 代表 导数 ， 所 以 它 的 输入 是 数 (代表 计算 
导数 的 点 ) ， 返 回 也 是 数 (该 点 的 导数 ) 。 这 人 人 es 0 po 
即 先 验 条 件 一 一 正 位 置 就 是 d/dx 本 身 一 一 即 后 





这 样 ， 我 们 就 更 正 的 、 正 确 的 函数 构造 函数 的 定义 : 


(define (function dom rng) 
(lambda (pos neg) 
(let ([dom-c (dom neg pos)] 
[rng-c (rng pos neg)]) 

(lambda (val) 

(if (procedure? val) 

(lambda (x) (rng-c (val (dom-c x)))) 
(blame pos)))))) 


练习 
将 此 应 用 于 之 前 的 例子 ， 确 认得 到 的 责备 符合 预期 。 此 外 ， 手 动 展开 代码 以 了 解 为 何 。 


更 进一步 ， 假 设 我 们 定义 d/dx 的 正 位 置 标签 为 "d/dx body" ， 负 位 置 标签 为 "d/dx input" 。 
假设 我 们 传 给 它 函 数 number->string (此 有 函数 明显 无 法 计算 导数 ) ， 然 后 将 结果 应 用 
a : 


((d/dx (guard (function (immediate number?) 
(immediate string?)) 
number->string 
"Nn->s body" 
"n->s input")) 
10) 


这 正确 地 表明 ， 责 备 应 该 归 短 于 将 number->string 作为 假定 的 数 函 数 提供 给 d/dx 的 表达 式 
一 一 而 不 是 d/dx 本 身 。 


练习 


手工 计算 qydx ， 将 其 作用 于 所 有 相关 的 违规 情况 ， 并 确认 由 此 产生 的 责备 是 准确 的 。 如 
果 你 将 string->number 传 给 d/dx ， 附带 函数 契约 指明 它 将 字符 串 映射 到 数 ， 会 发 生 什 
么 ?如果 你 在 没有 站 约 的 情况 下 传 入 相同 的 函数 呢 ? 


其 他 调用 语义 
很 久 以 前 ， 我 们 讨论 过 问题 。 现 在 是 时 候 考 虑 一 些 替 代 方 案 了 。 当 
时 ， 我 们 只 提出 了 一 种 方案 ; 其 实 还 有 更 多 选择 。 要 理解 这 一 点 ， 请 试 着 回答 这 个 问题 : 
下 列 哪些 是 相同 的 ? 


© (f x (current-seconds)) 
© (f x (current-seconds)) 
© (f x (current-seconds)) 


© (f x (current-seconds)) 


我 们 将 会 发 现 ， 这 上段 语法 可 以 对 应 非常 不 同 的 运行 时 行为 。 上 比如 我 们 提 到 过 的 区 别 : 不 同时 

间 求 值 ES seconds) 的 不 同 2 另 一 个 不 同 是 求 值 四 少 (因此 f 运行 的 次 数 有 
多 少 ) 。 还 有 一 个 不 同 ， x 的 值 是 严格 从 调用 者 流向 被 调用 者 ， 还 是 甚至 可 能 以 相反 的 方向 
流动 ! 


17.1 情 性 调用 


先 来 考虑 参数 何 时 规约 为 值 。 即 ， 我 们 是 将 形 参 替 换 为 实 参 的 值 喝 ， 还 是 实 参 表 达 式 本 身 ? 
如 果 我 们 定义 


(define (sq x) (* x x)) 
然后 这 样 调用 


(sq (+ 2 3)) 


(C(t 203) (GE 20.3) 


? 前 者 被 称 为 及 早 (eager) 调用 ， 后 者 则 被 称 为 惰性 (lazy) 调用 。【 注 释 】 当 然 ， 我 们 不 
想 回 到 替换 模型 来 定义 解释 器 ， 但 将 替换 视 为 设计 原则 总 是 有 用 的 。 


有 些 人 将 前 者 称 为 严格 的 (strict) 。 更 加 具 汲 难 解 的 术语 将 前 者 称 为 调用 次 序 求 值 
(applicative-order evaluation ) ， 后 者 称 为 正常 次 序 求 值 (normal-order evaluation ) 
还 有 ， 前 者 称 为 传 值 调用 (call-by-value) a (call- Eb bo 或 传 需 
求 调 用 (call-by-need) 。 en | ， 我 
们 将 在 后 文 讨论 。 关 于 名 字 的 介绍 就 到 这 








17.1.1 惰性 调用 示例 


惰性 这 一 选择 有 着 辉煌 的 历史 (例如 ， 纯 正 的 入 演算 就 用 它 ) ， 但 淡出 了 编程 实践 ，( 初 译 意 义 
存疑 请 校对 ) 问 题 在 于 ， 某 些 运 算 符 不 在 调用 时 对 参数 求 值 ， 而 只 当 需 要 其 值 时 才 求 值 。 例 
如 ， 考 虑 定义 


(define ones (cons 1 ones) ) 


在 标准 Racket 中 ， 这 显然 是 有 问题 的 : ( 左 侧 的 ) ones 还 没有 完成 定义 ， 我 们 就 (在 右 侧 ) 
尝试 对 它 求 值 ， 所 以 这 会 导致 错误 。 人 但是， 如果 我 们 不 直接 对 它 求 值 ， 直 到 我 们 站 正 需要 它 
时 ， 那 么 这 个 定义 就 成 立 了 。 因 为 每 次 rest 操作 都 会 获得 另 一 个 ones ， 我 们 得 到 了 一 个 无 
穷 链表 。 


我 们 略 过 了 很 多 需要 解释 的 地 方 。 cons 的 rest 位 置 求 值得 到 的 是 ones 的 副本 呢 ， 还 是 原 
表达 式 本 身 呢 ? 换 名 话说， 我 们 是 简单 地 创建 了 无 限 展 开 的 链表 ， 还 是 创建 了 实际 上 循环 的 
链表 ? 


这 很 大 程度 上 取决 于 我 们 的 语言 是 否 带 有 赋值 。 如 果 有 赋值 ， 那 么 也 许 我 们 可 以 修改 结果 链 
表 中 的 每 个 单元 格 ， 这 意味 着 我 们 可 以 观察 上 述 两 个 实现 之 间 的 区 别 : 在 展开 版 本 中 ， 修 改 
一 个 first 不 会 影响 另 一 个 ， 而 在 循环 版 本 中 ， 更 改 一 个 first 会 影响 所 有 其 他 。 因 此 ， 在 
有 赋值 的 语言 中 ， 我 们 可 能 会 倾向 与 惰性 展开 ， 而 不 是 循环 数据 。 


请 记 住 这 里 的 讨论 。 我 们 现在 无 法 解决 问题 ; 所 以 我 们 先 仔细 检查 一 下 惰性 求 值 ， 然 后 回 到 
这 个 问题 。 
17.1.2 什么 是 值 ? 


回 到 之 前 的 核心 高 阶 函 数 解 释 器 ， 我 们 记得 0 0 00 0 
我 们 要 问 ， 在 函数 调用 中 怎么 处 理 。 究 竟 传 入 什么 


这 似乎 很 明显 : 在 惰性 调用 语义 中 ， 我 们 需要 传 入 表达 式 。 但 细 想 就 有 问题 了 。 表 达 式 中 包 
含 标 识 符 名 称 ，【 注释】 而 我 们 不 希望 它们 被 意外 地 绑 定 。 


现在 ， 它 们 昌 的 是 标识 符 而 不 是 变量 ， 我 们 马上 会 发 现 。 


例如 ， 假 设 我 们 有 


(define (f x) 
(lambda (y) 
(+ x y))) 


这 样 调用 它 : 


((f 3) (+ x 4)) 


这 应 该 返回 什么 ? 
显然 ， 应 该 得 到 错误 ， 报 告 X 没 有 被 绑 定 。 


现在 来 逐步 分 析 。 第 一 步调 用 创建 闭 包 ， 其 中 x 人 
到 (+ x 4) ， 于 是 得 到 表达 式 (+ x (+ x 4)) ， 而 其 环境 中 x 是 绑 定 的 。 因 此 我 们 得 到 答 
案 10 ， 而 不 是 错误 。 


思考 题 

我 们 这 里 做 了 什么 微妙 的 假设 吗 ? 
是 的 ， 我 们 有 : 我 们 假定 + 会 对 参数 求 值 并 返回 数 作为 答案 。 也 许 + 也 可 以 是 情 性 的 ; 我 们 
稍 后 研究 这 个 问题 。 不 管 怎么 说 ， 重 点 不 变 : 如 果 我 们 不 小 心 的 话 ， 这 个 错误 的 表达 会 得 到 
某 种 合法 的 答案 ， 而 不 是 错误 。 
如 果 您 认为 这 问题 只 关于 错误 的 程序 ， 因 此 可 以 专门 处 理 (例如 ， 先 扫描 程序 源 寻 找 自由 标 
识 符 ) ， 下 面 是 同一 个 f 的 另 一 个 的 用 法 : 


(let ([x 5]) 
((f 3) x)) 


这 应 该 返回 什么 ? 


正常 来 说 这 应 该 求 得 (+ 3 5) 的 结果 ( 即 8 ) 。 但 是 ， 如 果 我 们 在 算术 表达 式 中 替换 x ， 我 
们 会 得 到 (+ 3 3) 。 


后 面 这 个 例子 提示 了 解决 方案 的 关键 所 在 。 在 这 个 例子 中 ， 只 有 当 我 们 用 到 环境 时 ， 问 题 才 
会 出 现 ; 反之 如 果 我 们 使 用 替换 ， 一 遇 到 let 就 替换 函数 调用 中 的 x ， 结 果 就 符合 期 望 。 事 
实 上 ， 请 注意 ， 这 个 观点 对 前 一 个 例子 也 适用 : 如 果 我 们 使 用 替换 ， 那 么 x 的 出 现 就 导致 错 
误 。 简 而 言 之 ， 我 们 必须 确保 基于 环境 的 实现 能 匹配 替换 所 能 做 到 的 。 听 起 来 熟悉 不 ! 


换 种 说 法 ， 解 决 方案 是 将 参数 表达 式 与 其 环境 捆绑 在 一 起 : 即 创建 闭 包 。 此 闭 包 没有 参数 ， 
2 
这 里 的 thunk， 但 是 直觉 告诉 我 们 ， 更 好 的 做 法 是 为 逻辑 上 不 同 的 目的 使 用 不 同 的 数据 表 


示 : closv 表示 用 户 创建 的 闭 包 ， 用 另 一 种 东西 表示 内 部 创建 的 闭 包 。 事 实 上 ， 正 如 我 们 将 
看 到 的 那样 ， 将 它们 分 开 是 明智 的 做 法 ， 因 为 有 一 个 地 方 我 们 需要 能 将 它们 区 分 开 来 。 


事实 上 ， 这 表明 函数 有 两 个 用 途 : 用 值 替换 名 称 ， 推 迟 蔡 换 。 let 只 有 前 一 个 功能 而 没 
有 后 一 个 ; thunk 只 有 后 一 个 功能 而 没有 前 一 个 。 前 文 已 经 明确 ， 前 者 本 身 是 有 意义 的 ; 
本 节 表 明 后 者 也 是 如 此 。 


总 结 来 说 ， 现 在 我 们 新 的 值 的 集合 是 : 


(define-type Value 
[numv (n : number)] 
[closV (arg : Symbol) (body : ExprC) (env : Env)] 
[suspendV (body : ExprCc) (env : Env)]) 


前 两 个 变 体 完 全 不 变 ; 第 三 个 是 新 的 ， 正 如 我 们 所 讨论 的 ， 它 实际 上 是 一 个 无 参数 的 子 程 
序 ， 正 如 其 类 型 所 暗示 的 那样 。 


17.1.3 何 时 求 值 ? 


回头 来 讨论 算术 表达 式 。 对 (+ 1 2) 求 值 时 ， 惰 性 调用 的 解释 器 可 以 返回 好 几 种 东西 ， 
括 (suspendV (+ 1 2) mt-env) ° 【注释 】 通过 这 种 方式 2 挂 起 的 计算 可 以 串 上 挂 起 的 计 
在 极限 情况 下 ， 任 何 程序 都 会 立即 返回 "答案 ”: 表示 暂停 计算 的 thunk。 


包 
算 ， 


这 里 放 上 mt-env (译注 ， 空 白 环 境 ) 是 合理 的 ， 因 为 就 算 (+ 1 2) 表达 式 存在 与 非 空 的 
环境 中 ， 它 其 中 也 不 包含 自 有 标识 符 ， 因 此 不 需要 任何 环境 的 绑 定 。 


显然 ， 必 须 有 啥 东西 来 强制 解除 暂停 。 ( 当然， 解除 暂停 的 意思 是 ， 在 存储 下 来 的 环境 中 对 

主体 求 值 。) 这 种 解除 表达 式 暂 停 的 位 置 称 为 严格 点 (strictness point) 。 最 明显 的 严格 点 
是 交互 式 环境 的 打印 ， 因 为 如 果 用 户 使 用 交互 环境 显然 是 希望 看 到 答案 。 我 们 用 strict 子 程 
序 表示 解除 暂停 : 


(define (strict [v : Value]) : Value 
(type-case Value V 
[numv (n) v] 
[closV (a b e) v] 
[suspendVv (b e) (strict (interp b e))])) 


这 里 返回 的 value 保证 不 是 suspendv 。 我 们 可 以 假设 打印 程序 会 对 被 求 值 的 表达 式 调 
用 strict ， 以 获得 要 打印 的 值 。 
思考 题 

如 果 使 用 闭 包 来 表示 暂停 计算 ， 后 果 是 哈 ? 


这 个 strict 定义 依赖 于 区 分 延迟 计算 的 能 力 一 一 哪些 是 内 部 构建 的 闭 包 ， 哪 些 是 用 户 定义 的 
闭 包 。 如 果 我 们 将 两 者 混为一谈 ， 那 么 这 里 就 不 得 不 猜测 如 何 处 理 零 参数 闭 包 。 如 果 没 有 进 
一 步 处 理 它们 ， 我 们 可 能 会 错误 地 得 到 报错 (例如 ，+ 可 能 会 得 到 thunk 而 不 是 其 中 的 数 


值 ) 。 如 果 进 一 步 处 理 ， 我 们 可 能 会 意外 地 过 早 调用 用 户 定义 的 thunk。 总 之 ， 对 于 thunk 我 们 
需要 一 个 标志 ， 告 诉 我 们 它们 是 内 部 的 还 是 用 户 定 义 的 。 为 了 清晰 起 见 ， 我 们 的 解释 器 使 用 

独立 的 变 体 。 

接 下 来 讨论 strict 和 解释 器 之 间 的 互动 。 不 幸 的 是 ， 按 我 们 原来 的 定义 ， 这 将 导致 无 限 循 

环 。 要 解释 加 法 ， 需 要 先 创建 暂停 ， strict 会 试图 解除 暂停 ， 这 需要 用 解释 器 来 解释 加 法 ， 
而 这 又 ...... 显 然 ， 我 们 不 能 让 每 个 表达 式 都 简单 的 暂停 计算 ; 相反 ， 我 们 只 暂停 函数 调用 。 

这 不 会 使 语言 变 得 荒 谓 ， 又 足以 让 我 们 拥有 惰性 求 值 的 强大 力量 。 


17.1.4 解释 器 
照例 ， 我 们 将 分 步 定 义 解释 器 。 


<lazy-interp> : := 
(define (interp [expr : ExprCc] [env : Env]) : Value 
(type-case ExprC expr 

<lazy-numC-case> 

<lazy-idC-case> 

<lazy-plusC/multC-case> 

<lazy-appC-case> 

<lazy-lamC-case>)) 


数 很 容易 : 它们 已 经 是 值 了 ， 所 以 没 必要 暂停 它们 : 


<lazy-numC-case> ::= 


[numC (Cn) (numv n)] 


闭 包 同样 保持 不 变 : 


<lazy-lamC-case> : := 


[lamC (a b) (closv a b env)] 


标识 符 应 该 返回 它们 所 绑 定 的 内 容 : 


<lazy-idC-case> ::= 


[idc (n) (lookup n env)] 


Er 、 


术 表 达 式 的 参数 通常 被 定义 为 严格 点 ， 不 然 的 话 我 们 会 不 得 不 在 其 他 地 方 实现 实际 的 算术 
算 : 


代 党 


<lazy-plusC/multC-case> ::= 
[plusC (1 r) (num+ (strict (interp 1 env)) 
(strict (interp r env)))] 


[multC (1 r) (num* (strict (interp 1 env)) 
(strict (interp r env)))] 


最 后 我 们 要 处 理 函 数 调用 。 在 这 里 ， 我 们 不 再 对 参数 求 值 ， 而 是 将 其 暂停 。 然 而 ， 遂 数位 置 
必须 是 严格 点 ， 否 则 我 们 不 知道 要 调用 什么 函数 ， 也 就 不 知道 如 何 继续 计算 : 


<lazy-appC-case> ::= 
[appCc (f a) (local ([define f-value (strict (interp f env))]) 
(interp (closV-body f-value) 
(extend-env (bind (closV-arg f-value) 


(suspendV a env)) 
(closV-env f-value))))] 


这 就 行 了 ! 添加 一 种 新 的 答案 、 揪 入 一 些 strict 、 并 在 函数 调用 参数 位 置 用 SuspendV 替 
换 interp ， 我 们 就 将 及 早 调用 解释 器 转换 成 了 惰性 调用 了 。 然 而 ， 这 个 小 小 的 变化 对 我 们 编 
写 的 程序 有 着 巨大 的 影响 ! 要 更 全 面 地 了 解 这 种 影响 ， 请 学 习 Haskell 或 Racket 中 


的 #lang lazy 语言 。 

练习 
如 果 我 们 把 标识 符 子 名 替换 为 (strict (lookup n env)) ( 即 对 查找 标识 符 的 
用 strict ) ， 会 对 语言 产生 什么 影响 ?请 考虑 更 丰富 的 语言 的 情况 ， 比 如 包含 数据 结构 
的 情况 。 

练习 
编写 一 些 程序 ， 它 们 在 惰性 来 值 下 会 给 出 和 及 早 来 值 不 同 的 结果 (在 两 种 情况 下 ， 同 样 
的 程序 给 出 不 同 的 结果 ) 。 请 给 出 有 意义 的 差异 ， 一 个 返回 suspendV 而 另 一 个 不 不 算 算 。 
比如 说 ， 一 个 会 终止 而 另 一 个 不 会 ， 或 者 一 个 会 产生 错误 而 另 一 个 不 会 ? 

练习 


调整 两 个 解释 器 ， 让 它们 记录 求 得 答案 的 步 数 。 对 于 在 两 种 求 值 策略 下 产生 相同 答案 的 
程序 ， 一 个 策略 是 否 总 是 比 另 一 个 需要 更 多 步骤 ? 


17.1.5 惰性 和 赋值 


惰性 求 值 的 优点 之 一 是 它 会 延迟 执行 。 通 常 这 是 好 事 : 它 使 我 们 能 够 构建 无 限 的 数据 结构 ， 
还 能 避免 不 必要 的 计算 。 不 幸 的 是 ， 它 也 改变 了 计算 发 生 的 时 间 ， 尤 其 是 表达 式 求 值 的 相对 
时 间 ， 这 取决 于 何 时 遇 到 严格 点 。 结 果 是 ， 程 序 员 和 。 当 表达 式 执行 
赋值 操作 时 ， 这 显然 是 个 问题 ， 因 为 现在 要 预测 程序 将 计算 出 什么 得 非常 困难 (相对 及 
早 求 值 来 说 ) 。 


这 导致 了 ， 所 有 情 性 语言 的 核心 中 都 不 支持 赋值 。 在 Haskell 中 ， 赋 值 和 其 他 状态 操作 都 通过 
monad (单子 ) 和 arrow (箭头 ) 等 多 种 机 制 ， 引 入 了 (严格 ) 序列 化 代码 的 能 力 后 再 引 
入 ; 这 种 顺序 性 对 于 能 够 预测 执行 顺序 以 及 操作 结果 至 关 重 要 。 如 果 程 序 结构 良好 ， 这 些 依 
赖 关 系 的 数量 应 该 很 小 ; 此 外 ，Haskell 类 型 系统 试图 在 类 型 本 身 中 反映 这 些 操作 ， 因 此 程序 
员 可 以 更 轻松 地 推理 其 效果 。 


17.1.6 缓存 计算 结果 


既然 已 经 得 出 结论 ， 情 性 计算 必须 不 包含 赋值 ， 我 们 观察 到 一 个 令 人 愉快 的 结果 (能 不 能 称 
其 为 副作用 呢 ? ) : 给 定 国定 的 环境 ， 同 一 表达 式 总 会 产生 相同 的 答案 。 其 结果 是 ， 当 表达 
式 第 一 次 被 严格 求 值 时 ， 运 行 时 系统 可 以 缓存 其 值 ， 并 在 随后 计算 它 时 返回 这 个 缓存 值 。 当 
然 ， 这 种 缓存 (这 是 记忆 化 (memoization) 的 一 种 形式 ) 只 有 当 表 达 式 每 次 返回 相同 的 值 时 才 
成 立 ， 这 正 是 我 们 所 假设 的 。 实 际 上 ， 编 译 器 和 运行 时 系统 可 以 积极 地 在 程序 的 不 同 部 分 中 
使 用 相同 的 表达 式 ， 并 且 如 果 其 环境 的 相关 部 分 相同 ， 则 合并 求 值 。 每 当 需 要 被 暂停 的 计算 
时 都 求 值 的 策略 称 为 传 名 调用 ; 将 结果 缓存 起 来 ， 则 称 为 传 需求 调用 。 


17.2 响应 式 调用 
来 考虑 这 个 表达 式 (current-seconds) 。 求 值 时 ， 它 返回 一 个 数 ， 代 表 当 前 时 间 。 例 如 ， 


> (current-seconds) 
1353030630 


但 就 算 我 们 盯 着 这 个 值 ， 它 已 经 过 时 了 ! 它 表示 函数 调用 发 生 的 时 间 ， 而 不 会 不 保持 当前 秒 
数 。 


17.2.1 动机 样 例 : 计时 状 
假设 我 们 要 实现 一 个 计时 器 ， 记 录 经 过 的 时 间 。 理 想 情况 下 ， 我 们 想 这 样 写 : 


(let ([start (current-seconds)]) 
(- (current-seconds) 


start)) 
在 JavaScript 中 就 是 : 
d = new Date(); 


current d.getTime( ); 


D 
start = d.getTime(); 
elapsed = current - start; 


在 大 多 数 机 器 上 ， 此 Racket 表 达 式 ， 或 JavaScript 中 elapsed 的 值 将 被 求 得 为 0 ， 或 着 某 个 
非常 小 的 数字 。 这 是 因为 这 些 程序 代表 了 经 过 时 间 的 一 次 度量 : 即 第 二 次 调用 获取 当前 时 间 
子 程序 时 的 时 间 。 这 样 我 们 拿 到 一 个 瞬间 的 时 间 值 ， 而 不 是 实际 的 计时 器 。 


在 大 多 数 语 言 中 ， 要 构建 盖 正 的 计时 器 ， 我 们 必须 创建 菜 种 计时 器 对 象 的 实例 ， 然 后 设置 回 
调 。 每 当时 钟 滴答 时 ， 计 时 器 对 象 一 这 里 代表 操作 系统 一 都 会 调用 回调 函数 。 然 后 回调 
负责 更 新 系统 其 余部 分 的 值 ， 祈 求 这 能 全 局 并 一 致 地 完成 。 但 是 ， 回 调 函 数 无 法 通过 返回 值 
来 实现 这 点 ， 因 为 它 会 返回 到 操作 系统 ， 而 操作 系统 无 法 预知 我 们 的 应 用 程序 ， 也 不 关心 ; 
因此 ， 回 调 只 能 通过 赋值 来 执行 其 行为 。 例如 在 JavaScript 中 : 





var timerID = null; 
var elapsedTime = 0; 


function doEverySecond() { 

elapsedTime += 1; 

document .getElementById('curTime').innerHTML = elapsedTime; } 
functron seartrmer (nD 

timerId = setInterval(doEverySecond, 1000); } 


假设 这 里 的 HTML 页 面 id 为 curTime ， 并 且 onload 或 其 他 回调 会 调用 startTimer 。 


要 避免 这 种 意大利 面 风格 的 代码 》 一 种 替代 方案 是 应 用 程序 反复 向 操作 系统 轮 询 当 前 时 间 。 
然而 : 


。 过 于 频繁 地 调用 会 浪费 资源 ， 而 调用 过 于 不 频繁 则 会 导致 错误 的 值 。 不 过 ， 要 以 恰当 的 
频率 进行 调用 ， 我 们 需要 先 有 一 个 计时 器 信号 ! 

。 尽管 可 以 为 诸如 定时 器 之 类 的 常规 事件 创建 这 样 的 轮 询 循环 ， 但 对 于 诸如 用 户 输入 等 不 
可 预知 的 行为 (其 频率 通常 不 能 被 预测 ) 的 来 说 ， 这 是 不 可 能 的 。 

。 除 此 之 外 ， 编 写 这 样 的 循环 会 污染 程序 的 结构 ， 迫 使 开发 人 员 承 担 额外 的 负担 。 


然而 ， 基 于 回调 的 解决 方案 展示 了 控制 的 倒置 (inversion of control) 。 现 在 ， 操 作 系 统 负责 
调用 (从 而 进入 ) 应 用 程序 ， 而 不 是 应 用 程序 调用 操作 系统 (所 提供 的 功能 ) 。 理 论 上 响应 
行为 应 该 在 深度 谋 套 于 显示 表达 式 的 内 部 ， 但 它 实际 上 位 于 顶层 ， 其 值 会 驱动 其 他 计算 。 这 
么 做 的 根本 原因 在 于 ， 控 制 掌握 在 世界 而 不 是 程序 手中 ， 所 以 外 部 刺激 而 非 内 在 的 程序 表达 
式 决定 了 程序 何 时 运行 以 及 如 何 运行 。 


17.2.2 回调 的 类 型 是 四 字母 单词 


这 种 模式 的 特征 (或 者 说 签名 ) 体现 在 类 型 中 。 由 于 操作 系统 对 程序 的 值 并 不 知情 ， 所 以 回 
调 通常 没有 返回 类 型 ， 或 者 只 返回 通用 的 状态 指示 值 ， 而 不 是 特定 于 应 用 程序 的 值 。 因 此 ， 
在 静态 类 型 语言 中 ， 它 们 的 类 型 通常 是 四 个 字母 的 单词 。 例 如 ， 下 面 是 Java 中 某 GUI 库 的 片 


段 : 


anterface GnangelBistenermextends Eventirstenermt 
vond stateGhanged(ChangeEvent ne) 0 


lnterface Actionlistener extends Event Erstenermnt 
void actionPperformed(ActionEvent ee 上 


interface MouseListener extends EventL1istener 1{ 


vornd mouseGlreked(MouseEVvenmt ej 小 
vand mouseEmtered(MoOuUsSeEvent ey) (0 


OCaml 中 是 这 样 


mainLoop : unit -> unit 
closeTk : unit -> unit 


destroy : 'a Widget.widget -> unit 
Update : unit -> unit 


pack : ... -> 'd Widget.widget list -> unit 
grid : ... -> 'b Widget.widget list -> unit 


在 Haskell 中 ， 这 四 个 字母 中 包含 一 个 额外 的 空格 


select :: Selecting w => Event w (IO ()) 

mouse :: Reactive w => Event w (EventMouse -> IO ()) 
keyboard :: Reactive w => Event w (Eventkey -> IO ()) 
resize :: Reactive w => Event w (IO ()) 

focus :: Reactive w => Event w (Bool -> IO ()) 
activate :: Reactive w => Event w (Bool -> IO ()) 


诸如 此 类 。 在 所 有 这 些 情况 下 ， 类 似 “void” 类 型 的 存在 清楚 地 表明 这 些 函 数 不 会 返回 任何 有 意 
义 的 值 ， 所 以 它们 唯一 的 目的 必须 是 修改 贮存 或 者 具有 其 他 副作用 。 这 也 意味 着 复杂 的 组 合 
手段 (例如 表达 式 的 肯 套 ) 是 不 可 能 的 : void 类 型 语句 唯一 的 组 合 操作 是 顺序 执行 。 因 此 这 些 
类 型 表明 我 们 将 被 迫 放 育 编写 虞 套 表 达 式 。 


当然 ， 通 过 我 们 之 前 对 Web 编 程 的 讨论 ， 读 者 熟知 这 个 问题 。 由 于 没有 状态 ， 服 务 器 上 有 这 
个 问题 ; 由 于 单线 程 ， 客 户 端 上 也 有 这 个 问题 。 至 少 在 服务 器 上 ， 我 们 能 够 用 continuation 解 
决 这 个 问题 。 ee ， 不 是 所 有 的 语言 都 支持 continuation， 并 且 实 现 continuation 也 会 很 繁 融 。 
此 外 ， 设 置 合适 的 continuation 作 为 回调 来 传递 可 能 会 非常 辐 手 。 因 此 ， 我 们 将 探索 另 一 种 解 
决 方案 。 


17.2.3 替代 方案 : 响应 式 语言 


考虑 DrRacket 中 的 FrTime (发 音 为 “Father Time”) 语言 。【 注 释 】 如 果 我 们 在 交互 窗口 中 运 
行 下 面 的 表达 式 ， 我 们 仍然 得 到 0 或 者 非常 小 的 正 数 : 


(let ([start (current-seconds )] ) 


(- (current-seconds) 
start)) 


在 DrRacket v5.3 中 ， 必 须 从 “语言 /Language” 菜 单 中 选择 该 语言 ; 只 写 刘 ang frtime 不 
会 提供 想 要 的 交互 窗口 行为 。 


事实 上 ， 我 们 可 以 尝试 其 他 几 种 表达 式 ， 看 上 去 FrTime 似 乎 与 传统 的 Racket 完 全 一 样 。 


但 是 ， 它 还 绑 定 了 额外 一 些 标识 符 。 例 如 ， 有 一 个 值 绑 定 到 seconds 。 如 果 我 们 将 其 输入 交 
互 窗口 的 提示 符 ， 结 果 非 常 有 意思 ! 首先 我 们 看 到 13536366306 ， 然 后 一 秒 后 1353936631 ， 再 
一 秒 1353639632 ， 诸 如 此 类 。 这 种 值 被 称 为 行为 《behavior) : 随时 间 变 化 的 值 。 但 是 我 们 
没有 编写 任何 回调 或 其 他 代码 将 其 值 保 持 最 新 。 


行为 可 以 用 于 计算 。 例如 可 以 这 么 写 (- seconds seconds) ， 并 且 它 总 是 计算 为 6 。 请 在 交 
互 提示 符 中 尝试 更 多 表达 式 : 


(add1 seconds) 

(modulo seconds 10) 

(build-list (modulo seconds 10) identity) 
(build-list (add1 (modulo seconds 10)) identity) 


正如 你 所 看 到 的 ， 行 为 是 "粘性 的 ”: 如 果 任 何 子 表达 式 是 行为 ， 和 包含 它 的 表达 式 也 是 。 


基于 这 里 的 求 值 模型 ， 每 当 seconds 更 新 ， 整 个 应 用 程序 重新 求 值 : 因此 ， 即 使 我 们 写 了 看 
似 简单 的 表达 式 ， 不 包含 任何 明确 的 循环 控制 ， 程 序 仍然 会 “循环 "。 换 句 话 说， 最 早 我 们 探索 
的 调用 语义 ， 其 中 参数 被 求 值 一 次 ， 接 下 来 的 调用 语义 中 ， 参 数 可 能 被 求 值 零 次 ， 现 在 这 个 
调用 语义 会 根据 需要 对 参数 以 及 与 它们 对 应 的 整个 函数 进行 多 次 求 值 。 因 此 ， 表 达 式 “内 部 ”的 
响应 式 值 不 再 需要 被 带 到 “外 部 ”; 相反 ， 它 们 可 以 诅 套 在 表达 式 中 ， 为 程序 员 提 供 更 自然 的 表 
达 方 式 。 这 种 评估 方式 称 为 数据 流 (dataflow) 或 函数 响应 式 (functional reactive ) 编程 。 


历史 上 ， 数 据 流 一 般 指 的 是 语言 具有 一 阶 函 数 ， 而 函数 响应 式 语言 支持 高 阶 部 数 。 


FrTime 实 现 了 我 们 所 说 的 透明 响应 式 ， 即 程序 员 可 以 在 程序 求 值 的 任意 位 置 插入 响应 行为 ， 
而 无 需 对 其 上 下 文 进行 任何 语法 修改 。 这 么 做 的 优点 是 ， 现 有 程序 中 很 易于 加 入 响应 式 ， 但 
这 也 使 求 值 模型 更 加 复杂 ， 程 序 员 估 计 复 杂 度 也 变 难 了 。 在 其 他 语言 中 ， 程 序 员 需要 通过 适 
当 的 原 语 明确 地 引入 行为 ， 不 那么 方便 ， 但 可 预测 性 更 强 。FrTime 的 姊妹 语言 Flapjax 有 是 
JavaScript 的 扩展 ， 同 时 支持 这 两 种 模式 。 


参见 Flapjax 网 站 。 


17.2.4 实现 透明 响应 式 


要 使 现 有 语言 实现 透明 响应 式 ， 我 们 必须 〈 自 然 地 ) 改变 函数 调用 的 语义 。 分 两 步 来 做 。 首 
先 将 响应 式 函 数 调用 改 号 成 更 复杂 的 形式 ， 然 后 我 们 将 展示 这 种 更 复杂 的 形式 支持 响应 式 更 
新 。 


17.2.4.1 数据 流 图 的 构建 


使 函数 调用 具有 响应 性 的 本 质 很 容易 通过 去 语法 糖 来 解释 。 假 设 我 们 已 经 定义 了 新 的 构造 

器 behavior 。 该 构造 器 的 输入 为 一 个 thunk， 表 示 每 次 参数 更 新 时 要 执行 的 计算 ， 以 及 表达 式 
所 依赖 的 所 有 的 值 。 构 造 器 的 返回 值 存储 行为 的 当前 值 。 那 么 (f x y) 这 样 的 表达 式 就 展开 
为 


(if (or (behavior? x) (behavior? y)) 
(behavior (A () (f (current-value x) (current-value y))) x y) 
(f x y)) 


其 中 我 们 假设 ， 如 果 输 入 是 常数 而 非 行为 ， 那 么 current-value 的 行为 就 是 恒 等 函 数 。 
来 看 一 下 使 用 上 述 定义 的 两 个 例子 。 考 虑 两 个 参数 都 不 是 行为 的 简单 情况 ， 例 如 (+ 3 4) 。 
去 语法 糖 得 到 


(if (or (behavior? 3) (behavior? 4)) 
(behavior (入 () (+ (current-value 3) (current-value 4))) 3 4) 
(+ 3 4)) 


由 于 3 和 4 都 是 数 而 非 行为 ， 这 就 规约 为 (+ 3 4) ， 正 是 我 们 想 要 的 。 这 反映 了 一 个 重要 的 
原则 : 当 没 有 行为 出 现时 ， 程 序 的 行为 完全 等 同 于 与 非 响应 式 语 言 版 本 。 


如 果 计 算 (+ 1 seconds) ， 展开 为 


(if (or (behavior? 1) (behavior? seconds)) 
(behavior (入 () (+ (current-value 1) (current-value seconds))) 1 seconds) 
(+ 1 seconds)) 


由 于 seconds 是 行为 ， 这 规约 为 
(behavior (入 () (+ (current-value 1) (current-value seconds))) 1 seconds) 
果 其 他 表达 式 依 赖 于 此 ， 现 在 它们 都 会 看 到 其 参数 也 是 行为 ， 于 是 该 属性 如 我 们 之 前 所 论 
证 ~ 那样 是 “粘性 的 ”。 
练习 
上 述 去 语法 糖 是 否 依赖 于 及 早 求 值 ? 如果 有 的 话 ， 是 以 什么 方式 ? 
17.2.4.2 数据 流 图 的 更 新 


当然 ， 仅 仅 构建 行为 值 是 不 够 的 。 这 里 关键 的 附加 信息 位 于 behavior 的 参数 中 。 语 言 会 过 滤 
掉 那 些 本 身 是 行为 的 参数 (例如 前 0 seconds ) ， 并 将 新 行为 注册 为 取决 于 现 有 行为 的 行 
为 。 这 个 注册 过 程 创建 了 行为 表达 式 的 依赖 关系 图 ， 称 为 数据 流 图 (dataflow graph) (因为 它 
反映 了 数据 流动 所 需 的 路 径 ) 。 


如 果 程 序 求 值得 到 的 不 是 行为 ， 那 么 只 能 是 答案 ， 并 且 这 也 不 会 创建 图 表 。 但 是 ， 如 果 存 在 
行为 依赖 ， 那 么 求 值 不 会 产生 传统 的 答案 ， 而 会 产生 行为 值 ， 并 且 会 记录 其 依赖 。 (实践 
中 ， 有 必要 记录 下 哪些 原始 行为 实际 地 被 用 到 ， 以 避免 不 必要 地 对 程序 中 没有 引用 的 其 他 原 
始 行为 求 值 ) 。 总 之 ， 程 序 执行 会 生成 数据 流 图 。 因 此 ， 我 们 需要 的 不 是 新 的 、 专 门 的 语言 
求 值 器 ; 而 是 要 将 图 形 构 建 语义 褒 入 到 传统 求 值 器 中 


现在 可 以 运行 数据 流传 播 算法 了 。 每 当 原始 行为 发 生变 化 时 ， 该 算法 会 调用 其 存储 的 thunk ， 
获取 新 值 ， 存 储 之 ， 然 后 发 信号 给 依赖 于 它 的 所 有 行为 。 例 如 ， 如 果 seconds 更 新 ， 它 会 通 
知 对 应 表达 式 (+ 1 seconds) 的 行为 。 后 者 于 是 对 其 thunk 求 值 ， 

即 (A () (+ (current-value 1) (current-value seconds))) ° 这 会 对 seconds 的 最 新 值 加 el > 
将 其 作为 该 行为 的 的 新 值 一 一 正如 我 们 所 期 望 的 那样 。 


17.2.4.3 求 值 顺序 
上 面 对 图 更 新 的 讨论 过 于 简单 了 9 考虑 以 下 程序 : 


(> (add1 seconds) 
Seconds ) 


这 个 程序 里 有 一 个 原始 行为 ， seconds ， 构 造 了 两 个 新 行为 : 分 别 是 (addl seconds) 和 整个 
表达 式 。 


我 们 期 望 这 个 表达 永远 计算 为 鉴 。 但 是 ， 当 seconds 更 新 时 ， 取 决 于 处 理 更 新 的 顺序 ， 可 能 

会 在 更 新 (add1 seconds) 之 前 更 新 整个 表达 式 。 假 设 seconds 的 昌 值 是 100 ， 所 以 新 值 

是 101 。 但 是 ， (add1 seconds) 的 节点 仍然 存储 了 其 昌 值 (因为 它 尚未 更 新 ) ， 所 以 它 的 值 

~ (add1 100) 即 101 。 这 意味 着 > 会 比较 161 与 1 (译注 ， 此 处 应 为 101 ) ， 得 到 假 ， 
这 个 表达 式 返 回 了 其 静态 描述 不 可 能 产生 的 值 。 这 种 情况 被 称 为 毛刺 (glitch) 。 


避免 上 面 例子 所 描述 的 毛刺 的 方案 很 简单 (而 且 可 以 证 明 这 么 做 足够 了 ) 。 就 是 对 节点 拓扑 
排序 。 每 个 节点 只 在 它 所 依赖 的 节点 更 新 后 才 被 处 理 ， 因 此 不 存在 查看 过 时 或 不 一 致 的 值 的 
危险 。 


在 图 中 出 现 循环 时 间 题 变 得 难 了 。 在 这 种 情况 下 ， 我 们 需要 特殊 的 递 具 莫 子 来 为 循环 行为 提 
供 初 始 值 。 这 样 做 就 打破 了 循环 依赖 关系 ， 将 求 值 简化 为 已 定义 的 过 程 。 


关于 数据 流 语言 的 求 值 还 有 很 多 可 以 讨论 的 内 容 ， 例 如 条 件 的 处 理 、 还 有 离散 和 流 式 
(stream-like) 行为 对 偶 的 概念 。 我 希望 你 会 去 阅读 响应 式 语言 的 文献 ， 以 便 更 多 地 了 解 这 


练习 


之 前 我 们 提 到 过 一 个 Haskell 库 。 不 过 ， 公 平地 说 ， 我 们 展示 的 响应 式 解 决 方案 是 用 
Haskell 来 阅 述 的 ， 因 为 惰性 求 值 更 容易 支持 这 种 求 值 形式 。 


用 情 性 求 值 实现 响应 式 。 


17.3 回溯 调用 


同一 个 调用 可 能 发 生 多 次 的 另 一 个 原因 是 ， 它 是 搜索 树 的 一 部 分 。 这 类 语言 的 调用 语义 试图 
去 满足 搜索 ; 如 果 成 功 ， 则 返回 成 功 的 信息 ， 但 如 果 失 败 ， 则 会 重 试 调用 以 期 成 功 。 当 然 ， 
这 假定 程序 是 按照 可 以 尝试 的 选项 编写 的 ， 直 到 搜索 成 功 。 因 此 ， 具 有 回溯 调用 语义 的 语言 
的 核心 操作 是 逻辑 析 取 (disjunction ， 或) 。 出 于 各 种 原因 ， 此 类 语言 还 支持 逻辑 合 取 
(conjunction ; 与) ， 其 中 一 个 原因 是 ， 实 现 逻 辑 非 会 有 问题 ， 所 以 通常 的 布尔 代数 规则 并 
不 适用 。 


17.3.1 通过 搜索 获得 满足 


要 描述 回溯 搜索 问题 ， 最 简单 的 方式 是 基于 简单 二 进 制 值 目标 。 (TODO: 不 满意 这 一 段 番 
译 ， 校 对 请 修改 ) 对 布尔 变量 来 说 ， 即 使 只 是 寻找 满足 命题 公式 的 解 ， 从 性 能 的 角度 来 看 计 
算 上 是 有 挑战 性 的 ， 并 且 这 在 各 种 现实 世界 问题 中 非常 重要 。【 注 释 1】 然 而 ， 我 们 只 讨论 这 
个 问题 的 简化 版 本 ， 只 使 用 布尔 常量 而 非 变 量 ， 这 样 我 们 只 需要 确定 公式 的 莫 实 性 就 可 以 
了 。 不 那么 有 趣 ， 但 它 会 帮助 我 们 建立 一 般 的 、 实 际 上 有 趣 的 情况 。 【注释 2】 


参见 “SAT 求解 器 "的 众多 用 途 。 
对 于 这 种 特殊 情况 ， 制 定 监 值 表 就 可 以 了 ， 但 对 一 般 情 况 这 不 起 作用 。 


假设 我 们 的 输入 是 包含 析 取 、 合 取 和 表示 真 假 的 常量 的 公式 。 目 标 是 判定 公式 本 身 求 值 为 丰 
还 是 假 。 我 们 希望 尽量 减少 计算 量 ， 当 发 现 答案 无 论 哪 一 个 一 一 我 们 都 希望 尽快 将 其 返 
回 到 依赖 于 它 的 上 下 文 。 例 如 ， 如 果 在 计算 某 个 合 取 过 程 中 发 现 茶 个 项 为 假 ， 我 们 希望 整个 

( 合 取 ) 项 立即 得 假 一 一 条 件 表 达 式 求 值 中 的 短路 求 值 概念 。 而 且 ， 我 们 也 希望 这 种 做 法 能 
泛 化 到 调用 堆栈 中 : 如 果子 表达 式 求 得 丨 或 假 ， 并 且 这 可 以 决定 包含 表达 式 的 值 了 ， 那 么 它 
也 应 该 快速 地 “通知 所 在 堆栈 ”。 








因此 ， 一 般 来 说 ， 每 个 计算 都 应 该 再 带 两 个 容器 参数 : 一 个 用 来 报告 前 术语 为 夏 (如 果 发 现 
是 监 ) ， 另 一 个 报告 为 假 (如 果 发 现 是 假 )。 为 了 避免 未 决 函 数 调用 等 问题 的 复杂 性 ， 我 们 
认为 这 两 个 参数 的 值 都 应 是 continuation， 以 便 该 值 尽 可 能 快 地 回 到 正确 的 上 下 文中 ， 而 不 
通过 中 间 级 别 的 求 值 ， 那些 步骤 和 结果 无 关 。 


信息 ， 代 表 旨 或 假 ) 。 因 为 默认 情况 下 continuation 需要 有 个 参数 ， 我 们 用 一 个 符号 来 表示 已 


最 容易 的 值 是 看 和 假 本 身 。 之 前 说 过 ， 所 有 表达 式 都 会 读 入 两 个 continuation， 称 为 成 功 和 失 
败 continuation， 如 果 式 子 具 有 明确 的 值 ， 则 调用 其 中 一 个 。 因 此 ， 卜 值 调 用 成 功 
continuation， 而 假 值 调用 失败 : 


(define (truth t1 t2) (ti1 'yes)) 
(define (falsity ti1 t2) (t2 "no)) 


现在 我 们 来 讨论 析 取 。 为 了 简单 起 见 ， 我 们 将 讨论 其 双 目 版 本 。 和 所 有 计算 一 样 ， 两 个 回 济 
搜索 的 析 取 必须 接受 成 功 和 失败 continuation 。 


<try-or-bt> : := 


(define (try-or t1 t2) 
(lambda (success failure) 
<try-or-bt-body>)) 


从 概念 上 讲 ， 最 简单 的 方式 是 创建 两 个 局 部 continuation， 称 之 为 pass 和 fail ， 并 传递 
给 tl 求 值 。 如 果 t1 (或 者 递归 地 ， 它 的 菜 个 子 计 算 ) 成 功 ， 控 制 将 返回 到 创建 pass 的 上 下 
文 ; 如 果 失 败 ， 则 返回 到 fail 。 


如 果 控制 返回 到 pass ， 我 们 就 知道 第 一 个 子 表达 式 成 功 了 。 但 是 因为 对 于 析 取 ， 这 就 够 了 ， 
所 以 我 们 现在 可 以 将 控制 交 给 continuation success 。 因 此 任何 对 pass 的 调用 都 应 该 立即 能 


发 success “ 


反之 ， 假 设 tl 失败 。 那 我 们 应 该 试 试 t2 。 因 此 fail 应 被 定义 在 序列 操作 中 ， 接 下 来 要 党 
试 t2 ; 如果 td 成功， 控制 将 不 会 以 这 种 方式 返回 。 接 下 来 尝试 t2 时 ， 不 必 担 

心 pass 和 fail :在 ti 失败 后 ， 整 个 析 取 的 成 功 和 失败 等 同 于 t2 ( 尾 位 置 的 一 种 形式 ) 
的 成 功 和 失败 ， 因 此 它 的 成 功 和 失败 continuation 与 整个 表达 式 的 相同 。 于 是 ， 我 们 获得 : 


<try-or-bt-body> : := 


(success (let/cc pass 
(begin 
(let/cc fail 
(t1 pass fail)) 
(t2 success failure)))) 


因此 ， 如 果 ti 成 功 ， 则 控制 返回 到 创建 pass 的 上 下 文 ， 即 调用 success 。 如 果 ti 成 功 
(译注 ， 应 为 失败 ) ， 则 控制 返回 到 创建 fail 的 continuation， 也 就 是 序列 中 的 下 一 个 语 
钙 ，t2 。 


根据 对 称 推理 ， 我 们 可 以 得 到 对 偶 的 try-and 程序 : 


(define (try-and t1 t2) 
(lambda (success failure) 
(failure (let/cc fail 
(begin 
(let/cc pass 
(t1 pass fail)) 
(t2 success failure)))))) 


为 了 方便 测试 ， 我 们 可 以 编写 封装 函数 ， 将 这 些 基于 continuation 的 回复 转换 为 简单 的 值 : 


(define (run t) 
(let/cc escape 
(t (lambda (v) (escape 'yes)) 
(lambda (v) (escape 'no))))) 


然后 以 此 创建 测试 案例 ， 从 


(test (run (try-or falsity falsity)) "no) 


到 


(test (run (try-or (try-and (try-or falsity truth) (try-or truth falsity)) 
(try-and truth (try-and falsity truth) ))) "yes) 


